作者:李东耳

大模型发展势头如火如荼,不少公司都已经发布了自己的大模型。专注AI和智能语音的云知声也于5月24日发布了通用大模型产品——山海大模型。

云知声推出自己的大模型产品并不意外,此前也一直有消息称云知声将发布医疗版ChatGPT。不过相比于2个月前各公司推出大模型时的声量,云知声的大模型似乎没有引起太大的声响。

5个月推出山海大模型  但客户使用是个问题

根据科技部5月28日发布的《中国人工智能大模型地图研究报告》,目前国内10亿参数规模以上的大模型已发布至少79个。随着大量大模型的发布,人们关注的重点已经不是大模型能够回答几个问题或能不能算对数学题,而是这些大模型能在哪些领域应用,目前是否具备使用能力,以及能否与自身业务相结合。

云知声山海大模型目前的应用行业主要有医疗、销售、知识管理、口语、物联网等几个领域。

医疗领域是云知声的主要服务领域,此前还曾因在医疗领域的市场份额引来行业巨头的公开“打假”。但云知声确实是在医疗这一垂直领域长期研究了不少年,拥有一定的专业数据基础。在大模型发布已经较晚的当下,发挥在医疗行业的优势做垂直领域大模型,已经是云知声这些后发小厂商不得不采取的战略。

同理,云知声在销售、知识管理等领域也已经有了相应的系统积累,在此基础上利用大模型进行升级也可以提供更好的服务。

除了将现有业务与AI相结合外,云知声目前所发布的内容主要还是集中在NLP(自然语言处理)上。如在山海大模型,用户可以借助AI发现并改正自己的英语发音,并进行对话以提升英语能力。如果得到大规模应用,可以帮助不少有英语听说练习需要的人减少大量学习成本,在教育领域可以得到广泛的应用。在物联网领域,云知声可以让智能家居产品不再只是简单执行命令,而是可以更好地理解人们所说的自然语言,并进行更加接近人的语言互动。

只从发布的内容看,山海大模型具备一个成熟大模型应有的基本条件,功能丰富并可以满足基本需要,准确率也在及格线之上,不少功能具备大规模商业化应用的基础。从发布时间上看,山海大模型虽然发布得相对较晚,但也只是晚于行业巨头。

根据IDC的数据,2022年上半年中国人工智能语音语义市场中,科大讯飞、阿里云和百度智能云共占25.6%的市场份额,思必驰、小i机器人、拓尔思市场份额位居其后,但3家加起来只能与市场份额前三中的一家相当,其他厂商的具体市场份额IDC未公布,但被包含在“其他”里的云知声市场份额显然排在上述6家之后。

来源:IDC

然而一个摆在云知声面前的问题就是,并非先发布了大模型就能迎来转机,是否有足够的客户使用是个问题,毕竟只谈功能的话,云知声山海大模型所能提供的能力,其他友商似乎也可以提供,即便是在医疗领域,也有不少竞争者。

两年未获新融资 云知声或将再次上市?

AI是一个需要大量时间和资本支撑的领域,这也是为何率先发布大模型的大多是头部科技公司。云知声从成立以来就一直备受关注,除2015年没有宣布融资消息外,直到2020年正式递交招股书,云知声每年都有新的融资消息出现。

但云知声的上市计划并未能像其融资一样顺利。虽然科创板的设立让不少企业科技公司有了上市融资的机会,但一众AI独角兽的科创板IPO均不顺利,有些AI公司后来不得不暂时搁置上市计划,其中就包括云知声。

但云知声IPO的终止或许还有其他原因,其中来自科大讯飞的公开质疑,被不少人看作是云知声放弃上市计划的原因。

两家公司的恩怨或许早已埋下。成立于2012年的云知声就因创始人的原因受到不少关注,但真正让云知声成为焦点的,恐怕还是2013年的“锤子ROM”发布会。由于锤子使用的是云知声的解决方案,“云知声击败科大讯飞成为锤子ROM语音解决首选方案”一度出现在一些媒体对云知声的报道中。

虽然是第一次发布,但凭借罗永浩的网红效应,云知声之后很快就获得了乐视电视和搜狗的关注并成功达成合作。

或许是因为科大讯飞并没有把云知声的这一营销口号当回事,再加上确实因此开了个好头,2020年云知声递交招股书时就更加大胆,声称自己在白电市场和语音病历系统领域市占率均为70%,在病例质控系统方面市占率30%。

这一数据一出,科大讯飞的投资者先坐不住了。由于这两个领域也是科大讯飞的重要业务,若按云知声的说法,科大讯飞在相关领域早已没有了领先优势,因此投资人在互动平台上向科大讯飞询问相关数据。

科大讯飞随后以数据回应投资者称,以覆盖医院数量,云知声在2017年至2020年上半年的四个报告期分别为10、36、91和112家,科大讯飞同期分别为11、77、264和489家。从收入看,云知声上述时期智能语音病历收入分别为170.96万元、926.39万元、1628.91万元和895.48万元,科大讯飞同期分别为664.28万元、2937.27万元、3554.48万元、3571.11万元。在白电市场方面,科大讯飞也以数据反驳,云知声并没有达到领先科大讯飞的程度。

虽然云知声并没有回应此事,但不久后选择撤回IPO材料终止上市,难免让人怀疑云知声的底气。

IPO终止后,云知声又在2021年6月得到了一笔近亿美元的融资,但到目前为止,云知声已经差不多2年没有再拿到新融资了。

不过,也有人从2023年上半年云知声的频频亮相中,看到了一点云知声要再次IPO的端倪。如在3月发布的一篇名为《未来云知声上市可期?云知声赋能智能产品加速发展》的文章中,就明确提到“云知声将继续向感知与分析、认知技术、决策与生成三大方向发力,持续探索智能交互边界,以技术优势赋予 AIoT 无限想象,打开更多市场空间,并赋能企业自身发展,实现上市目标” 。在一篇对云知声创始人黄伟的采访中,黄伟表示云知声的估值还应该再高一些。

云知声能否破解AI企业盈利难题

不过,云知声当年终止IPO更主要的原因,可能还是难以盈利。AI公司不盈利问题一直被人诟病。

若以IDC的数据为准,排名前三的3家企业,均是规模较大,业务较为成熟的企业,其中科大讯飞很早就是国内智能语音方面的领跑者,阿里云和百度智能云的主要业务也不是依靠智能语音,并且都已经实现了盈利。排名第六的拓尔思虽然体量上不及科大讯飞,但目前的主要收入来源是大数据软件产品及服务,也有能力支援大模型相关的研发。

反观剩下两家第二梯队的智能语音企业,思必驰因盈利问题IPO被否,小i机器人虽然成功上市,但盈利情况也不稳定,上市以来股价基本上都在发行价以下。

云知声虽然在终止IPO后就没有公布过财务数据,但在招股书中,云知声曾明确表示短期内将无法盈利。而从组建团队到发布大模型,云知声只用了5个月的时间,这难免又需要大量资金。若无法得到新的融资,云知声的业绩将会继续承压。

云知声也有一些比较独特的AI技术,比如声音克隆。云知声的声音克隆就是复制一个与某人几乎一样的AI声音,使用者可以自己上传文本,并生成通过这个声音读出来的音频。

前段时间AI孙燕姿的大火,又一次引发了人们对AIGC在语音方面的关注。云知声虽然未对声音克隆功能做太多宣传,也还是有不少人想要尝试。根据笔者在云知声微信上线的小程序上的测试,从声音采集到生成完毕只用了不到半个小时的时间,生成完毕后再输入文本,确实可以得到和笔者朗读相似的声音。

或许是因为该功能在微信小程序上只是用来体验,用户虽然可以自定义语音内容但文本生成的语音无法下载,只能分享由小程序随机生成文本生成的音频,这虽然引来了关注度,但是如何实现商业化则有点令人费解。

回顾AI孙燕姿“出圈”不难发现,这不过是2022年AI绘画大火后在音乐领域的重现,虽然操作起来有些门槛,但要掌握并不难。不过,云知声在C端并没有什么运营经验,目前似乎也没进入C端的打算,在B端,声音克隆在医疗、销售等领域的应用空间也未形成。该功能虽然在文娱等领域确实存在一定的应用前景,但从公开信息来看,云知声似乎还没能将服务范围扩展到文娱行业的计划。

作为一家AI独角兽,云知声肯定是有独到之处,但发布得晚又没有打算商业化的特色业务,在智能语音这个巨头林立的行业,想要靠大模型杀出重围有点难。

(本文仅供参考,不构成投资建议,据此操作风险自担)

About Author

klwang