本文系基于公开资料撰写,仅作为信息交流之用,不构成任何投资建议。
当AI以一个特定的主题,在30秒内完成一篇文章 的写作,并在高中甚至大学某个年级的课堂里获得第一名的最终评价时,我们知道,对于我们的下一代来说,这个世界已经永远改变了。
(相关资料图)
不止是写作。当时当下,在全球各地各个产业领域内,一场以生成式AI为内核的人工智能革命,正在以不可逆的态势深入蔓延。ChatGPT为代表的生成式AI,已成为全球科技竞争的制高点。
随之而来的是关键命题是:中国AI科技领域,谁将是这场全球性科技竞赛的中坚破局力量?
这个问题的答案,出离不了算力、算法以及数据三个维度构成的产业规律。那些在人工智能领域持续耕耘的中国科技公司们,凛冬之后,终于捱到了自己的黄金时代。
比如科大讯飞(SZ:002230)。
作为ChatGPT主题研究的第二篇,本文将以讯飞为样本,透视中国生成式AI产业的当下与未来。
01中国AI进入无人区
“在做通用AI范式的时候可以想象站在一个沼泽地上,四面没有光,也没有手电,这时候咱都不说走多远,往哪边走都是个问题。这种情况下大家都选择了相对光明的道路,就是专用AI范式。不得不佩服美国人,他把这个事情 (AGI,通用人工智能) 从0到1的道路硬生生的走出来了。”这是日前一场专家电话会中,一位产业人士对于ChatGPT及其背后的OpenAI团队的感慨。
从专用AI到通用AI,即使OpenAI已成功闯关,但对中国的AI公司来说挑战仍然巨大,说是走入无人区毫不为过。不信你瞧谷歌:
ChatGPT火爆之后,被触及商业模式核心利益的谷歌最为着急。单纯从理论上来看,它做这个事情好像不难。毕竟就连ChatGPT的底层架构Transformer模型,都是来自谷歌。
但现实很残酷。谷歌的类ChatGPT项目Bard出师不利,员工通过内部论坛Memegen批评管理层最近推出的Bard:仓促、拙劣、毫无谷歌风范 (un-Googley) 。
ChatGPT的通关之路难度可见一斑。
但即使如此国内参与者也不得不跟。因为ChatGPT会对众多产业带来颠覆性变革,包括且不限于:
1)改变现有人机交互模式。
2)改变现有信息分发获取模式。
3)改变内容生产模式。
4)加速“AI for Science”的发展。
直观一点来说,互联网的核心价值是连接,ChatGPT代表的生成式AI的核心价值则是嵌入。如果嵌入至制造业,生成式AI的强大远景——存、算、编码生成一体化所带来的“随心所欲”效应,无疑意味着人类生产力能力文明级的跨越。但在这个质变发生 (在以制造业为核心的工业领域,质变发生仍受制于材料与能源) 过程中,生成式AI作为机器智能超算,最大化价值的用途还是嵌入到科研领域,将在基础学科研究、新材料、新能源、新药物的研发过程中扮演关键角色。
02科大讯飞的比较优势
目前诸多中国科技公司都在加紧布局类ChatGPT项目。所有谋局者之中,科大讯飞是比较优势较为突出的一个。主要体现在以下几个方面:
【1】数据卡位
前文我们提到,谷歌Bard背靠海量数据出师不利,反观ChatGPT当前最具产业价值的编程能力,很大功劳来自于GitHub。OpenAI在ChatGPT中引入了它830G代码文本,那是一亿程序员的智慧涌现,编程能力不强才怪。
图:GitHub的用户增长曲线,来源:网络
科大讯飞凭什么布局ChatGPT?OpenAI上述产业实践,以及在医疗领域的突破,也许能得出一些启示,那就是数据质量的重要性。
目前国内参与者在算法、算力上跟ChatGPT是有差距,但优质数据在一定程度上弥补了这个差距。比如ChatGPT最近通过美国执业医师资格考试,它在考试三个部分得分在52.4%-75%之间。而与医疗机构紧密合作的科大讯飞,其“智医助理”系统2017年就通过国家执业医师资格考试综合笔试测试,答对76%的题目 (满分600分,考了456分) 。目前“智医助理”作为全科医生助手已可以诊断1200多种常见病,累计提供5.5亿次AI辅诊建议。
放眼整个行业,长期布局AI技术的同时,又掌握医疗、教育等专业数据端口的公司是稀缺的,这是科大讯飞布局类ChatGPT项目的底气之一。
【2】算法与成本曲线
大模型的训练是一件烧钱的事。ChatGPT的诞生与用户广泛应用,离不开它对成本曲线改造:过去两年半时间,GPT-3模型的训练成本下降了80%以上,目前仅需要140万美元 (首次训练约1200亿美元) 。而成本曲线的降低离不开算法进步。道理很简单:同样是训练一次大模型,算法能力提升意味着成本曲线的降低。
OpenAI的成功在于算法迭代,GPT3比之GPT2在算法层面有本质提升 (于是它不开源了) 。所以创立8年烧钱不断的它还能获得资金支持,并终于等到ChatGPT横空出世。
回头看国内玩家,虽然公司间横向的算法直接对比没法做,这是商业秘密,但从侧面还是能看到一些端倪:
科大讯飞在GitHub上开源模型比较受追捧。具体而言,其开源了6个大类、超过40个通用领域的系列中文预训练语言模型,相关模型库月均调用量超1000万,在Github平台获得星标数 (相当于点赞) 位列同类中文预训练语言模型第一并远超第二名。
与此同时,科大讯飞承建了认知智能国家重点实验室。AI技术可简单分为识别 (图像识别、语音合成与识别等) 和认知 (语义理解、常识推理、知识图谱、阅读理解等) 两大类,承建认知智能国家重点实验室是官方对科大讯飞算法技术实力的背书。
图:科大讯飞 A I 里程碑,来源:国信证券
【3】算力战争
据最新的投资者关系交流会议显示,科大讯飞2009年至今,已建成4城7中心深度学习计算平台,自建业界一流的AI数据中心奠定大模型训练的硬件基石。在技术层面实现百亿参数大模型推理效率近千倍加速,为认知智能大模型经济实惠的规模化提供可能性。目前来看,基本满足类ChatGPT项目的布局。
但从长期看,科大讯飞乃至整个中国布局类ChatGPT项目的玩家,还是得大力加强算力的提升。从产业的发展趋势看,算力是企业乃至当前世界最关键的竞争资源。残酷的事实是,超级算力中心建设资金门槛已经在ChatGPT出现后,已经推向百亿之上 (在微软的支持下) ,而运营与维护成本更是天文数字。
基于优质数据卡位,算法能力和商业化策略 (下文详述) ,科大讯飞在算力维度至少有一点可以抓紧做:推动企业间的分布式计算协作。强如OpenAI亦绑定微软这个算力巨头,2月8日微软更是宣布将ChatGPT整合进其搜索引擎,未来随着类ChatGPT玩家的布局行至中场,合作的机会少不了。
03AI界的一股清流
在真实的商业世界,技术的硬实力永远不是全部,它无法具现一个组织看不到的软实力。事实上,对比绝大多数的AI公司,科大讯飞的软实力更为突出。
过去很长时间,科大讯飞一直是A股市场上的AI独苗。围绕其业绩的质疑声音一直没断过。直到背负巨额亏损的AI新势力们上市,外界方看到了其自力更生的难能可贵。
图:科大讯飞的净利润,来源: choi ce
与后进的AI新锐们不同,科大讯飞以语音识别起家,这条路线对于早期AI公司可能比较友好。众所众知,2006年Hinton利用预训练方法得出神经网络局部最优解,将隐含层推到了7层,神经网络真正上有了“深度”,由此揭开深度学习热潮。
所谓“深度”并没有固定数值,在语音识别中4层网络就能被认为是较深的 (例如谷歌产品voicesearch) 。在效果一定的同时,层数越小,难度越低,计算量越少,它有利于打通技术与商业化的双轮驱动,这对于AI从实验室走向产业的起步阶段非常重要。
AI的科技含量再高,它也是一门生意,先把商业的帐算清楚。任何商业的基本规律就是创造现金流、创造真金白银的产业附加值才能持续发展。组织能自负盈亏,才能稳健的进入其它技术分支——科大讯飞先是拥有我国唯一的“语音及语言国家工程实验室”,后来国家唯一的“认知智能国家重点实验室”也设在科大讯飞——一步步扩大公司的护城河。
之所以说科大讯飞更契合商业基本规律,因为这是一目了然的事情:你看所有布局类ChatGPT的玩家,只有它比较明确的开始讲应用讲商业,“1+N”架构的行业应用已经规划好了。
“1”是通用认知智能大模型算法研发及高效训练底座平台,“N”是应用于教育、医疗、人机交互、办公、翻译、工业、汽车等多个行业领域的专用大模型版本。例如,通过学习海量医学教材、论文和病例,实现专业的医疗领域对话式AI系统,打造“每个医生的AI诊疗助理,每个人的AI健康助手”。
运营节奏之外,科大讯飞是少数能做到既懂B端又懂C端的科技公司。
在中国既能服务企业、又能服务用户的科技公司屈指可数。科大讯飞服务C端,不仅指智能硬件销售,还有教育领域学生以年费形式订阅个性化学习手册和英语听说业务等。目前“个册”覆盖1400多所学校,口语业务2022年新增12个地市的中考和2个地市的高考。
科大讯飞有可能在医疗等板块打造C端应用的标杆,恰如ChatGPT的编程。当然,这是比较乐观的预期,C端能力的潜在可能性。关于可能性我们不再多谈,因为目前还为时尚早,期待科大讯飞的产品上线。
以上,成立于1999年的科大讯飞,23年风雨兼程之后,终于进入了自己的黄金时代,正成为布局ChatGPT玩家里的中坚力量。ChatGPT作为第四次工业革命开始的标志,世界商业秩序正面临剧变,没有人可以置身事外——如果改变世界的那个人/组织不是你,至少要和科大讯飞们站在一起。
凡本网注明“XXX(非现代青年网)提供”的作品,均转载自其它媒体,转载目的在于传递更多信息,并不代表本网赞同其观点和其真实性负责。
原标题:贺兰山中发现最早的西夏瓷窑址:反映了两宋与西夏交融的历史澎湃新闻记者高宇婷宁夏贺兰山内一项重大考古项目的发掘,使得西夏王朝的
2023-02-19 17:35
原标题:河北尚义发现中国北方万年文化史最新实证国家文物局15日召开“考古中国”重大项目重要进展工作会,通报5项重要考古成果。河北尚义四台
2023-02-19 11:39
原标题:行进中的经典北京人艺《雷雨》再上演中新网北京2月18日电(记者高凯)一座周公馆,几代《雷雨》人,2月17日晚,北京人艺经典剧目《雷
2023-02-19 11:51
原标题:今日雨水:雨润大地气象新中新网北京2月19日电(记者上官云)斗转星移,冬去春来。“雨水”是春天的第二个节气,恰好处在数九的“七九
2023-02-19 09:45
原标题:长影开展全国首次小屏虚拟制片深度测试中工网讯(工人日报-中工网记者柳姗姗彭冰)日前,长影第三摄影棚开展全国首次针对小型LED屏的
2023-02-19 08:35
原标题:今日雨水工人日报-中工网记者陈子蕴今日6时34分,雨水至。从今天开始,雨量渐增。春雨过后,阳光开始浸染早春大地。值此时节,草木开
2023-02-19 08:53
原标题:走出一条更具东方美学的动画道路(主题)——访中国美术学院动画与游戏学院教师蔡智超(副题)光明日报记者张玉梅于园媛许馨仪编者按
2023-02-19 08:54
原标题:声音从头顶飞过《中国乒乓》做了啥?北京青年报记者田婉婷经历了春节期间临时撤档、延期,电影《中国乒乓之绝地反击》(以下简称《中国
2023-02-19 08:48
原标题:电影票房、剧集点击率、图书动销量、热搜与热评……一个个数据都在佐证,中国科幻题材正乘风破浪驶向广袤宇宙(引题)专访刘慈欣:我
2023-02-19 08:56
原标题:《情满九道弯》演绎北京胡同情怀中工网讯(工人日报-中工网记者赖志凯)京味现实主义题材电视剧《情满九道弯》,2月17日起,在中央电
2023-02-19 07:50
原标题:《巨区林屋·轴》王蒙[元]台北“故宮博物院”藏王蒙(1308~1385年),字叔明,自号“黄鹤山樵”。吴兴(今浙江湖州)人。元末明初画家
2023-02-19 05:45
【进击吧,国产科幻2】原标题:科幻作家刘慈欣接受《工人日报》专访——(引题)“有生之年,会看到许多技术领域的重大突破”(主题)工人日报
2023-02-19 05:42
【视线】原标题:《2022年中国游戏产业报告》发布(主题)游戏产品注重中华文化内涵(副题)中工网讯(工人日报-中工网记者苏墨)日前,《2022
2023-02-19 05:48
原标题:义乌:经济奇迹背后的文化底蕴2月16日,在义乌城市规划馆中,导游向参观者们介绍义乌从最初的小城发展到世界小商品之都的历程,并介绍
2023-02-19 05:34
【艺评】原标题:AI能写情书,可它能表达“心”吗?罗筱晓刚刚过去的情人节,最近在全网走红的ChatGPT当了一次气氛组成员——帮使用者写情书。
2023-02-19 05:35
原标题:382件文物文献首次汇聚二十世纪初中国古文献四大发现展作者:王伟伟近日,“二十世纪初中国古文献四大发现展”在国家典籍博物馆开展。
2023-02-18 13:40
原标题:拿掉“贵妃醉酒”恢复“翠盘舞”180人庞大阵容(引题)新版京剧《大唐贵妃》重现千古绝恋(主题)摄影 北京青年报记者王晓溪2月17日至
2023-02-18 13:33
原标题:曹操高陵可能有宋代守陵户中国文化报驻河南记者张莹莹近日,记者从河南省文物考古研究院获悉,国家社科基金项目“曹操高陵及陵园综合
2023-02-18 13:42
原标题:老舍教老外说中文作家老舍一生不仅著作颇丰,还有着近三十年的教育教学生涯,在英国进行对外汉语教学更是其域外经历中尤为重要的一部
2023-02-18 07:36
原标题:“行走在水墨和青绿之间”旅美画家艺术作品展在天津开展中新网天津2月17日电(王在御刘俊苍)2月17日,“行走在水墨与青绿之间”洪波画
2023-02-18 05:50
原标题:范伟新剧《立功·东北旧事》开播(引题)这部悬疑喜剧东北味特别足!(主题)羊城晚报记者胡广欣又一部在东北取景的悬疑剧集开播。12
2023-02-17 16:50
原标题:《夏花》热播:都市情感剧的新审美之“花”中新网北京2月16日电(记者高凯)“古早”与“先锋”,“简单”与“多层次”,“精微”与“
2023-02-17 16:41
原标题:山西大同发现唐墓58座出土各类随葬器物300余件(套)中新网太原2月17日电(高雨晴胡健)山西省考古研究院17日对外发布考古成果,考古人
2023-02-17 16:42
原标题:歌剧《刑场上的婚礼》2月16日,由广州大剧院与华南理工大学联合出品的原创歌剧《刑场上的婚礼》新闻发布会在广州大剧院举行。发布会现
2023-02-17 16:48
原标题:这部动画短片集由11位导演打造了8个根植于中国传统文化的独立故事(引题)刚收官就被“催更”的《中国奇谭》如何出炉(主题)解放日报
2023-02-17 15:52