我爱52网

 找回密码
 注册[Register]

QQ登录

只需一步,快速开始

手机号码,快捷登录

查看: 1251|回复: 0

阿里云推新,“杠”上讯飞

[复制链接]

1166

主题

398

帖子

-1万

积分

积分
-17096
发表于 2023-6-2 19:42:28 | 显示全部楼层 |阅读模式
阿里云推新,“杠”上讯飞,我爱破解

泉源:猎云精选;文 / 孙媛
" 这不降维 battle 讯飞吗?"
昨日,在朋侪圈一张通义听悟的专属口令福利海报下,一位媒体工作者留言道。
彼时在粤港湾大湾区的广州,阿里云 CTO 周靖人对通义听悟给出了如下形貌:作为一款工作学习 AI 助手,听悟对准具有高知识附加值的音视频内容场景,好比开会、上课、访谈、培训、口试、直播、看视频、听播客等,能通过大模子等最新 AI 技能快速提炼和沉淀知识。
一言以蔽之,就是听力好、悟性高,可以帮人随时随地高效完成对音视频内容的转写、检索、择要和整理,好比主动做条记、整理访谈、提取 PPT 等。而这正是讯飞腹地——讯飞闻声的主战场。
故意思的是,此前 5 月,同样也在粤港湾大湾区,只不外在澳门,科大讯飞表态了其大模子软件产物 " 讯飞闻声会写 ",就是基于对音频文件的内容 AI 分析,主动天生集会纪要、工作代庖、工作筹划,并支持基于原文内容举行 AI 对话和内容追溯。
简朴来看,不但功能类同,乃至展示的选址都相近。
会上,阿里云也绝不粉饰本身要挑衅智能语音转写头部的野心,直接拿出了互联网惯用的 " 补贴换用户 " 的攻城略地式营销计谋。公测期间,大量发放 20 小时转写口令码,乃至权益可累加达免费时长 100 小时以上,以讯飞闻声 App 中文 / 英文呆板快转尺度代价 0.33 元 / 分钟来盘算,听悟 100 小时免费时长可以说是给目的用户节流 1980 元的付出。
不管怎样,先说一句,补贴 " 真香 "。
对标讯飞,听悟有何差别
究竟上,这不是猎云网第一次打仗到听悟。在之前的云栖大会上,听悟就有内测版本,已经有离线语音 / 视频转写、及时转写、脚色分离、分屏记载等功能。但其时,阿里云的低调内测算是点到为止,好奇者先行。
时至本日,接入大模子本领的 " 通义听悟 ",作为一个大模子版的聚焦音视频内容的工作学习 AI 助手,融合了研发团队在推理、对齐和对话问答等方面的研究结果,不但能完成灌音转写,还能一键总结全文及差别发言人观点,显然也跟之前版本有较大提拔。
根据周靖人所说,听悟有两层寄义,起首是 " 听 ",可以或许听清内容,第二层寄义是要 " 悟 ",可以或许要明白此中的意思,真正为一样平常的工作、学习进步效能。故而此次猎云网的简朴测评也重要围绕这两点睁开。
起首,要想实验此次公测版本,现在微信小步伐端不支持及时转写,重要照旧通过通义听悟官网举行利用,同时可以关联本身的阿里云盘,举行音视频内容导入。语音转换上,可以开启及时记载(及时语音转笔墨)和上传音视频(音视频转笔墨)两种方式来实现。
在举行及时记载并同步翻译测试上,猎云网接纳了 B 站上 TED 官方标题为《ChatGPT 云云强盛,AI 的崛起让人类何去何从?》的视频语音。在同步翻译的过程中,可以发现比对中笔墨幕,听悟的翻译效果总体意思明白尚可,但是在语句在翻译的次序上有所毛病,譬如 " 在关于将来工作真正有效的东西 ",听悟的效果为 " 有效的关于工作的将来 ",同时大概存在部门罅漏的翻译环境,譬如 " 他们大概会抢走我们全部的工作 ",关于 " 抢走 " 这个动词没有表现。

阿里云推新,“杠”上讯飞,我爱破解

在音视频转笔墨测试上,猎云网接纳了讯飞闻声灌音笔录制的一段内容,通过上传阿里云盘,同步到听悟举行语音转换,发现就薄弱语音的信息捕获上,听悟优于讯飞闻声,捕获了一句讯飞闻声未转换的内容,而转换的正确度上,讯飞闻声更胜一筹,跟灌音内容同等,但听悟会出现个别词的错误转换。

阿里云推新,“杠”上讯飞,我爱破解

固然在听上,听悟今后次测试比对上总体看略逊色于讯飞闻声,但悟的明白及分析本领着实让人面前一亮,就猎云网提供的灌音来看,听悟在全文概要、章节速览以及关键词提取上除了个别字眼的错误外,团体较为正确,对于笔墨工作者来说其增效显着。

阿里云推新,“杠”上讯飞,我爱破解

从某种水平上来说,通义听悟定位为面向工作、学习的 AI 助手,是实至名归。通义听悟固然如今才举行公测,但早在阿里巴巴内部开展利用,并履历了从听到悟的升级过程。
据通义听悟技能负责人鄢志杰透露,已往许多项目管理的同砚上项目会,比方投资部到表面访谈、尽职观察,以及人力资源雇用等内部场景,听悟更多照旧做语音的记载、简朴回首跟整理。但从 2019 年开始,阿里云连续在大模子方面举行重点研发跟积聚,在基于通义千问大模子对笔墨和知识体系的明白 + 阿里云在音视频相干的模子本领,听悟才得以实现 AI 本领的场景化。
对准智能语音转写,实则以模子服务开局
正如上文所说,听悟对标的是讯飞闻声,但之以是阿里云先盯上音视频转写范畴,一方面是有着多年语音技能的积聚,另一方面也是对准了科大讯飞在国内智能语音转写市场的焦点领地。
自 2017 年 11 月讯飞在 " 用 AI 为天下赋能 " 的发布会上," 随手 " 展示了讯飞闻声的中英文及时字幕,便让这项堪称黑科技的产物,让其在 AI 1.0 期间初期,敏捷建立了 AI 龙头的位置。六年间,讯飞营收从 2017 年的 54.45 亿,一跃增长至 2022 年的 188.20 亿,对应 28.15% 的复合增速。
此中,讯飞重要提供 AI 办理方案平台、智能硬件(灌音笔)和移动互联网增值产物(输入法、讯飞闻声)的开放平台及消耗者业务,是仅次于教诲范畴的第二大营收泉源。在 2020 年至 2022 年,该业务的营收占比从 23.65% 增长至 2022 年的 24.66%。营收从 30.8 亿增长至 2022 年的 46.4 亿,对应复合增速为 22.74%。
从讯飞的数据来看,智能语音从企业营收以及用户需求层面是一个值得切入的好市场,除以科大讯飞、搜狗为代表的专业智能语音企业外,以阿里云、腾讯云为代表的云服务厂商,以网易为代表的专业转写或翻译厂商等也不停跃跃欲试,颇有三分天下的态势。
这一次,阿里云切入讯飞腹地,也算在料想之中。
只不外就拿产物和代价来说,现在功能相差不大的环境下,讯飞闻声的用户大概并不肯定会对听悟太感冒。听悟 " 补贴 " 虽香,但不要忘了科大讯飞多年前其凭一招 " 智能灌音笔用户享终身免费翻录服务 ",一举收割了编辑、分析师、状师、HR、门生等大量市场需求,行业职位临时无人能及。
据公开资料表现,科大讯飞的智能灌音笔市场份额在 2022 年增至 44%,在双十一期间内占 GMV 市场份额的 57%,市场份额不停保持第一。
从这个角度去看,听悟如今高调杀入智能语音市场,为 battle 讯飞造势及免费福利派送,更像是阿里云招呼各人来对听悟举行一次 " 实验 ",背后是来感受通义千问大模子的本领。
通义听悟背后依靠通义千问大模子,重要基于阿里云一系列技能投入以及相干的希望,而云和整个智能化密不可分。
周靖人在 4 月份有提到过云智一体等方面内容,阿里云从一开始计划包罗云和智能,这是两个紧张相辅相成的环节。他表现,特殊是从 IaaS、MaaS、PaaS 三层的架构来看,全部范畴实在都是在讲云团体的技能,包罗通义听悟以及通义千问,都是云技能在这个期间怎么快速厘革、快速应对以及在新期间海潮里怎样不停创新。
通义千问发布之后,阿里云就连续在天下推进快速摆设 AI 模子的工作,而通义听悟的推出更多像是一种官宣:阿里云不但在算法层面上,还把模子本领提拔到产物内里,去服务到更多开辟者大概各行各业。
也就是说,在这一波阵容之下,阿里云以通义听悟作为 MaaS(模子即服务)环节下的典范,想让更多企业及开辟者留意到,通过把模子练习和模子服务的本钱不停低落,开辟者可以把模子有用利用起来,对模子举行二次开辟,让阿里云的 AI 本领可以集成到他们业务中去,举行更多云上创新。
有专注大模子研究的投资人表现,语音转笔墨本领各家实在差距不大,转写是一样平常本领,更紧张的是能做到丢失紧张内容的环境下去布局化改写总结才是突破。
" 就通义听悟来说,更像是阿里云给通义千问大模子找落地场景,以及从数据源积聚上看也更为公道。"
卷大模子之争,AI 技能应用成核心
颇故意思的是,这边通义千问降维用通义听悟对标讯飞闻声,那里科大讯飞也以星火大模子飙入国内大语言模子赛道,其 CEO 刘庆峰还夸大 " 如今讯飞星火的语言明白本领,不但在国内是遥遥领先的,跟 ChatGPT 也仅仅一步之遥 "、" 我们在本年十月份之前就会凌驾(ChatGPT)"。
豪言壮志之下,科大讯飞的一季度财报并欠好看,业务收入 28.88 亿元,同比淘汰 17.64%;归属于上市公司股东的净利润 -5789.53 万元,上年同期为红利 1.11 亿元,营收、净利双降。固然这也部门 " 归功 " 于公司 2022 年 12 月 15 日启动了 "1+N 认知智能大模子专项攻关 ",攻关项目标新增投入。本年一季度,科大讯飞的研发投入到达 7.157 亿,同比增长了近 6%。
从听悟 PK 闻声,通义千问 PK 星火,不难发现,从这场智能语音的技能应用往上看,实质是大模子的根本比力。
据不完全统计,2 月复旦大学发布 MOSS;3 月清华大学发布 ChatGLM-6B、百度发布文心一言;4 月阿里云发布通义千问、知乎发布知海图 AI;5 月,科大讯飞发布星火、腾讯发布混元、360 发布 360GPT。再到 5 月 31 日,百度首创人李彦宏公布启动 " 文心杯 " 创业大赛,设立规模 10 亿元投资基金支持天生式 AI 范畴初创企业,一场从大模子层到应用层的 AI 怒潮正在加快。
从百度智能云在本季度实现了红利(non-GAAP)来看,百度率先吃到了大模子的红利,而李彦宏也表现筹划渐渐将文心一言融入百度的全部业务,为产物及服务赋能,吸引更广泛的用户及客户,围绕文心一言在新的期间中创建新生态。
对比之下,5 月 18 日阿里云 2023 财年营收增速为 3.5%,意味着在天生式 AI 带来了人工智能新模式的厘革中,在云之上,阿里云亟需寻求新增量——大模子至关紧张。
在通义听悟发布前,阿里云就推出了一系列全新的产物和代价政策,包罗 AI 大模子通义千问的结果展示及行业探索、推出焦点产物贬价和免费试用筹划、大幅进步互助同伴佣金率等。但万变不离其宗,重要目的就是扩大阿里云公共云的客户数目和用云规模,并动员各类 AI 模子练习和服务所需的高性能算力的增长,来为阿里云的久远发展构建更可连续的增长动力。
正如周靖人所说,通义听悟的发布并不是一个尽头,而是一个新出发点。
这场基于大模子的产物和企业办理方案的比力,序幕已拉开。

帖子地址: 

您需要登录后才可以回帖 登录 | 注册[Register]

本版积分规则

RSS订阅|小黑屋|处罚记录|申请友情链接|我爱破解 ( 浙ICP备20014855号-3 ) 渝公安备案 50011202501206

Powered by Discuz!

© 2001-2017 Comsenz Inc.

快速回复 返回顶部 返回列表