3月16日,百度创始人、董事长兼首席执行官李彦宏亲自上阵,为大家揭开了百度文心一言的面纱。随后,外界对文心一言的讨论都没有停止,百度的股价也跟着起起落落。
首先是发布会进行到半个小时左右,百度的股票就下跌超过7%,甚至一度跌破10%。这似乎源自被寄予厚望的文心一言在产品力上让外界略有失望,尤其是文心一言的展示并不是“直播”而是“录播”。
(资料图片仅供参考)
图/百度股价走势图(3.16日)
来源/老虎证券 燃次元截图
“作为一个交互产品,演示都不是现场的,这会让投资者和意向用户的体验大打折扣,也会不禁让人怀疑,百度自己是不是对产品都没有100%的信心。”一位看了全场直播的从业者聊起发布会的感受时,如实说道。
而随着发布会结束,第一批用户对文心一言开始了真实地测试后,百度股价有所回升。截至3月19日,百度港股股价报收142.2港元/股。一位百度工作人员对燃次元表示,“很多人都说文心一言实测体验比发布会看起来好很多。”
除了简单的测试,有才的网友们开始抛出五花八门的问题,把文心一言与ChatGPT作比较。比如“什么工作钱多活少离家近?”“模仿李白的《将进酒》写一首诗,主题是肯德基疯狂星期四。”而针对这些问题,文心一言给出的回答,颇令网友满意。
不过,也有一部分网友对文心一言的能力提出质疑。小红书ID为“易安学姐”的用户评价道,“文心一言的回答完全没有上下文链接。”网友makima评价道,“百度真的有测试过自己的AI吗?是放出来让别人替它训练吗?”
图/网友测试文心一言与ChatGPT对比图
来源/小红书 燃次元截图
与此同时,燃次元与多位测试文心一言,以及使用过ChatGPT的用户进行了交流后发现,大家对文心一言的看法很自然地分成了两派——鼓励派和批判派。
鼓励派表示,“ChatGPT对行业带来的场景化和用户习惯的改变将会是颠覆性的,文心一言的诞生是大势所趋,也是未来的趋势。”
批判派则反之,“文心一言在信息库更新、底层数据质量上和ChatGPT有很大的差距。且由于规范性不明确,从长远来看,并不看好国内ChatGPT类产品的发展。”
对于大家的批评,李彦宏表示,“文心一言并不完美,因为有市场需求,所以现在发布。大预言模型一旦发布,迭代速度会非常快。”
事实上,不论对文心一言看好还是看坏,市场对百度推出文心一言的原因都心知肚明。面对放缓的营业收入增速,和逐渐显现的人口红利天花板,百度急需第二增长曲线的切入口。
然而,尚不成熟的文心一言能成为这个切入口吗?国内大厂纷纷布局ChatGPT下,其商业化又有什么难以突破的瓶颈?
带着这些问题,燃次元也开始了对文心一言的测试... ...
文心一言,就这?
“感谢百度,我的工作保住了。”百度文心一言发布会结束后,一位投行人员打趣地对燃次元表示。
ChatGPT横空出世后,打工人最关心的问题莫过于,“如何利用ChatGPT赚钱”,以及“如何不被ChatGPT取代后赚不到钱”。
而百度文心一言的发布,无疑是给大家吃了颗“定心丸”。
但玩笑归玩笑,自文心一言推出后,确有不少人将它和ChatGPT尤其是GPT-4进行比较。在第一时间拿到文心一言的测试码后,燃次元便让其为汽车品牌极氪的车型“极氪001”写一则广告文案。文心一言迅速给出了回答,“极氪001,超越想象!”
相比之下,燃次元在文心一言发布前一周,问过ChatGPT类似的问题,“为理想L7写一份宣传语”,ChatGPT给出的回答,虽说不是完美,但却也包含了对理想L7性能的介绍以及亮点的总结。
当然,文案风格上,各花入各眼,没法评论好坏,文案的“功底”也很难评胜负。但就核心优势总结、对文案本身的内容理解,以及在信息的准确性和及时性等可以明确量化的方面,ChatGPT似乎略胜一筹。
燃次元曾让ChatGPT帮忙整理特斯拉已经发布的所有车型。根据ChatGPT的结果,其按发布时间分别罗列了Roadster、 Model S、 Model X 、Model 3和 Model Y。除了车型,还包括发布时间和性能简介。
然而,当燃次元把同样的问题,抛给文心一言时,文心一言不仅没能给出车型发布的时间,甚至连车型都没能给全,少了Model Y和Roadster。
图/上:文心一言回答;下:ChatGPT回答
来源/燃次元截图
与此同时,文心一言提供的信息也不完全准确。
当燃次元要求其“整理理想汽车2022年交付数据”时,文心一言回答,“理想汽车在2022年共交付了100054辆纯电动车型……”但事实上,理想并未推出纯电车型,当燃次元进一步说明其错误时,文心一言也没有及时修正。
图/文心一言回答 燃次元截图
当然,在类ChatGPT的产品中,回答出现事实性错误的,也并非只有文心一言一家。
此前,谷歌推出的Bard也出现了类似错误。对此,技术专家林宇表示,深度学习模型的输出结果会有不可解释性,这与其学习模型的属性有关,所以,类似的错误会有一定的出现概率。
除此之外,文心一言对同样问题的理解能力也会出现偏差。
比如,燃次元在体验其发布会上展示的图片输出功能时,就屡屡碰壁。最开始,当发出生成海报、图片等指示时,文心一言在超过30秒钟的加载后都会显示,“当前与我互动的人过多,请稍后再试。”
随后,当燃次元要求文心一言为迪士尼画一张海报时,文心一言却输出了语言描述的回答;当再次要求其用图片展示上述回答的时候,出现的海报却与迪士尼没什么关系。而再一次做出尝试,让其为迪士尼画一张海报时,终于,一张更类似迪士尼画风的画作被展现。
图/文心一言回答 燃次元截图
同一个问题得不到准确的回答或得到的答案不同,这或许与文心一言测试版的不稳定性有关。但也意味着,文心一言的底层理解能力尚待提升。
ChatGPT的“大混战”
就在文心一言的理解能力被多方调侃时,GPT-4的能力已经惊艳到了第一批试用用户。
海外投资经理科林表示,“我将一份长文的超链接发给GPT-4并要求其解读,GPT-4不但可以完全理解我的重点,还能将长文中的重点准确地摘取和总结出来。”
科林进一步表示,GPT-4在响应时间和文字承载量上也有很大进步,可以接受上限达2.5万字的长文,“对于我这种每天都要读几百页文字的金融从业者来说,非常有用,其会大大提高我的生产力。目前,我还在不断探索工具更多的可能性。”
图/GPT-4的回答
来源/科林供图
在GPT-4被用户追捧的同时,微软也推出了AI助手Copilo。结合GPT-4,AI功能被直接集成到Word、Excel、PowerPoint、Outlook和Teams等应用中。用户可以提出问题,将文字提炼、转化、生成PPT等,被称为“打工人的福音”。
北大在读博士小孔看完了Copilo的展示后感叹道,“我们要学习的东西还有很多。在我看来,将来不会使用ChatGPT类工具的人,在研究上效率会非常低。”
不只微软,谷歌、腾讯、科大讯飞、美团等多家国内外大厂都在陆续布局ChatGPT。一位脉脉从业人员对燃次元透露,从今年2月份开始,包括百度、阿里、腾讯等在内的科技巨头,都在陆续招聘ChatGPT相关的AIGC岗位,很多猎头也纷纷下场,最高开出了10万元的月薪。
BOSS直聘上,也有美团、BOSS直聘、百度文心产品线等企业和项目在招ChatGPT相关岗位。
图/BOSS直聘招聘
来源/燃次元截图
大厂为什么会在这个时候纷纷布局ChatGPT?
在科林看来,重要因素有两个。“第一是大厂们自身业务增长困境。以百度为例,百度整体的营收增速水平从2021年第一季度的24.79%下滑至2022年第四季度的0%。而作为百度主营业务的线上广告业务,收入在2022年更是出现了6%的同比下滑。”
数据来源/百度财报燃次元制图
“除此之外,更重要的是ChatGPT带来的应用场景的迭代。”科林进一步分析,“ChatGPT会彻底改变人们工作的方式,尤其是以搜索引擎为基础产品的百度。与其说百度布局ChatGPT,不如说布局ChatGPT是百度顺应时代的必要之举。而搜索引擎和ChatGPT本身的自然语言对话形式很相近,对于接入ChatGPT有属性上的天然优势。”
欧科云链研究院高级研究员蒋照生补充道,通过AI技术的落地,可以解决C端用户很多实际需求,比如大大提升工作、学习效率和生产力。
“大厂通过布局ChatGPT可以触达更多有需求的C端用户,不仅可以扩大自己的用户市场占有率,也可以进一步向TOC、 TOB等多种形式的商业化探索。”
让ChatGPT多“飞”一会
不难看出,未来ChatGPT或将是一项可以改变世界的技术,但大厂想要用ChatGPT实现新的突破,还需要经过重重考验。
首先,是信息的准确性。不论是向用户收费还是向企业收费,产品一旦开始收费,用户对失误率的包容性就会减弱。现在,大家还会对文心一言、ChatGPT偶尔的失误回答吐槽、打趣,但如果打工人利用这项工具输出工作内容,却发现错漏百出,那彼时,这种失误就会从“笑话”变成“事故”。
对此,科林直言,“大模型输出内容的准确性和及时性与其底层数据质量有极大的关系。目前国内类ChatGPT产品的底层数据质量尚待提升。”
其次,是产品的规范性。蒋照生分析,国内很多类ChatGPT产品的系统依然存在不稳定性,这最后会导致生成内容质量不一致。燃次元多次向文心一言发出相同请求,得出不同回答就是个典型的例子。对于商业化产品,这种不稳定性会存在风险。
再次,如何保证ChatGPT类产品的原创性、避免版权问题,以及保证ChatGPT类产品输出的内容符合法律和道德标准,也是不得不重视的问题。蒋照生补充道,以AIGC为例,大多数AIGC系统仍然缺乏创造力,不能独立生成原创内容,只能根据给定的模板或指导内容生成相关内容。
而ChatGPT作为人工智能工具,是没有任何“道德”标准的,开发者需要避免ChatGPT类产品给出的回答不与主流价值观相悖。林宇表示,“摘除一些敏感词汇的标签,是其中一个方式,但一个标签所衍生出的内容很广泛,摘除一个标签对于大模型学习的影响是极大的。这中间尺度的把握,是个挑战。”
除此之外,大模型所需要的海量算力,需要资金、人才、软硬件设施等各个环节的配合,缺一不可。
最重要的是,大厂如何能开发出让用户可以实际体验到有改变的ChatGPT类产品?比如,把一个PDF扔进ChatGPT,后者能生成一个准确概括重点内容的PPT,这是有效工具。但和ChatGPT闲聊,得出一些百度百科都能给出的信息,这只是“虚假”的创新。
尽管目前来看,规模化的商业变现对ChatGPT产品来说,还需要一段距离。但是,ChatGPT已经可以给一些业务和行业带来改变,帮助大厂优化成本、提升用户体验。
林宇、科林等多位业内人士均对燃次元表示,机械性高、重复性强的工作是可以利用ChatGPT优化的——人工客服就是最典型的一项。“事实上,现在已经有很多企业采用人工智能客服,但是他们能够理解的问题还是非常有局限的。ChatGPT可以理解更长、更复杂的问题,且交互形式更自然,能够进一步优化用户体验。”
而ChatGPT类产品,本身也会随着用户使用频次的增多,不断学习、更新。以百度文心一言为例,在公开测试后的短短几天,就已经有所进步。
比如,3月16日晚,燃次元第一次要求文心一言整理出百度公司2022年的现金流情况时,文心一言似乎并不能理解“整理”的意思。而到了3月18日下午,燃次元再次问出相同的问题时,文心一言已经可以准确理解问题并给出了百度现金流的信息。
图/文心一言回答 燃次元截图
由此不难看出,文心一言在不断地学习和纠错。
其实,不管是文心一言,还是其他类ChatGPT产品,是“黑”是“吹”都为时尚早。ChatGPT无疑是颠覆性的创新,但谁能因此获利,“子弹”还得再“飞”一会才能见分晓。
内容来源:燃次元
作者 | 吕敬之
标签:
凡本网注明“XXX(非现代青年网)提供”的作品,均转载自其它媒体,转载目的在于传递更多信息,并不代表本网赞同其观点和其真实性负责。
原标题:重庆钓鱼城遗址新发现南宋末年规模宏大建筑群日前,记者从重庆市文物考古研究院了解到,在重庆合川钓鱼城遗址新发掘了一批南宋末期建
2023-03-20 15:53
原标题:2023年中国电影票房已达150亿元截至今天上午9时50分,2023年中国电影票房(不含预售)已达150亿元人民币,总出票3 13亿张。(总台央视记者
2023-03-20 13:35
原标题:最美公共文化空间大赛颁奖典礼举行人民日报上海3月19日电 (记者谢卫群、方敏)日前,2022年长三角及全国部分省市最美公共文化空间大
2023-03-20 13:43
原标题:《安娜·卡列尼娜》“驶抵”中国舞台人民日报海外版记者郑娜巨幅天幕与投影组成的恢弘的火车站场景,朋克风的火车头载着满满的“旅客
2023-03-20 13:38
原标题:2023年度大盘票房突破150亿元!中国电影市场回暖电影行业复苏态势显现。据灯塔专业版数据,截至3月19日记者发稿时,2023年度大盘票房
2023-03-20 11:48
原标题:《美术里的中国》第三季邀您共赏青绿金碧绘写的壮丽山河万里江山频入梦,笔笔青绿此中来。中央广播电视总台大型纪录片《美术里的中国
2023-03-20 11:33
原标题:热播剧《他是谁》背后是“白银连环杀人案”?导演回应故事从1988年的割喉案开始,到8年后扑朔迷离的碎尸案,张译主演的悬疑刑侦新作《
2023-03-20 11:45
原标题:“恩格尔系数拉满了”是什么梗?扬子晚报 紫牛新闻记者孙庆云最近,一个叫做“恩格尔系数拉满了”的流行梗,被无数大学生们拿来调侃自
2023-03-20 11:35
原标题:春分究竟“分”什么?平分了整个春天平分了昼夜时间等长燕赵晚报讯(记者崔虹)明天将迎来春分节气,省会气温也比较配合,预计最高能到2
2023-03-20 11:42
原标题:叶派名剧《吕布与貂蝉》打头炮(主题)天津京剧院青京赛金奖演员惠民展演季启幕(副题)今晚报讯(记者王洋)天津京剧院青京赛金奖演
2023-03-20 09:53
原标题:北京砚台文化博物馆开馆彰显砚文化魅力中新网北京3月19日电(记者潘旭临)由北京砚文化发展研究会、中华炎黄文化研究会砚文化研究分会、
2023-03-20 09:33
原标题:四时唯爱春春更爱春分3月21日的清晨,我们将迎来春季的第四个节气——春分。这一天太阳黄经达0°,太阳直射赤道,南北半球昼夜平分,
2023-03-19 15:44
原标题:大江健三郎:如林中泉涌的作家文 启凌诺贝尔文学奖获得者、三个孩子的父亲、反战反核人士、音乐迷……大江健三郎一生有很多标签,但最
2023-03-19 15:47
原标题:“三分钟看电影”毁了谁韩浩月“三分钟看电影”是短视频平台流行的一种视频内容,不但有大量的制作者,也有海量的受众,受此影响,影
2023-03-19 15:32
原标题:惊悚片的套路,伤害了现实主义母题(主题)鉴定对象:《梅根》上映时间:3月17日(副题)文 李丽很多人还在担心被ChatGPT抢走饭碗,温
2023-03-19 15:36
原标题:春生夏长秋收冬藏作者:郅敏【艺术手札】 《二十四节气》系列作品是我从2015年开始的创作,至今已持续八年,完成了15件作品,还有9件
2023-03-19 14:44
原标题:从碑刻看金元鼎革之际华北社会的巨变雅玲95版《神雕侠侣》曾是多少人的青春回忆,剧中李莫愁吟唱的“问世间,情为何物,直教生死相许
2023-03-19 14:42
原标题:节令之美·春分丨21日5时24分春分:燕子来时春正好新华社天津3月19日电(记者周润健)“小燕子穿花衣,年年春天来这里,我问燕子你为
2023-03-19 14:33
原标题:镌刻二十四节气里的江南意境“无画不年”,是苏州人的一句老话,姑苏城的岁月,都凝结在了桃花坞木版年画里。3月17日,“镌录清嘉——
2023-03-19 11:55
原标题:从《桃花源记》到《桃源仙境图》作者:姜金军“桃之夭夭,灼灼其华”,这是《诗经》中对美好事物的期许,桃花盛开的地方总是充满着浪
2023-03-19 11:53
原标题:借“武林风中荷对抗赛”契机中荷文化交流活动在唐山举行中新网唐山3月18日电(白云水 孟潮)“这里的骨质瓷、皮影太迷人了,我要把这些
2023-03-19 11:52
原标题:导演刘家成:坚持“真实至上”以影视照见温暖现实光明日报记者吴潇怡牛梦笛【新闻人物】导演刘家成执导的电视剧《春日暖阳》正在北京
2023-03-19 10:38
原标题:首届中华戏曲邀请展启幕京剧《龙凤呈祥》率先亮相中新网天津3月18日电(王在御)国粹芳华经典呈现——首届中华戏曲精品邀请展于3月17日
2023-03-19 10:43
原标题:唐朝的时尚风尚标和盛世审美意象冯立君大唐宝历元年(825年),身在江南的白居易写下了《霓裳羽衣歌》,再现了长安宫廷的乐舞场景和他
2023-03-19 10:55
原标题:画壁上的千年寻踪【学人谈】敦煌莫高窟开凿距今已过去1650余年,在鸣沙山东麓的断层崖壁上,保存有从公元4世纪十六国时期到14世纪的元
2023-03-19 10:56