3月16日14:00,百度于北京举行新一代大语言模型、生成式AI产品“文心一言”发布会。经过近一个小时的介绍,文心一言的面纱终于被掀开,虽然李彦宏嘴里说这是“第一个同类产品”,但心里明显不自信,甚至自己也承认文心一言的“不成熟”。发布会上,百度创始人、董事长兼首席执行官李彦宏以及百度首席技术官王海峰分别对文心一言的功能和技术进行了介绍,而介绍的过程仅仅是一个加了五段demo视频的PPT,没有想象中的现场演示,更没有值得大呼wocao的亮点,也不对外开放使用。发布会一开始,百度港股便直线跳水,最大跌幅超过10%。这种感觉就像一群饥饿的人等着开饭,结果厨师端出来一盘食品模型!好吧,即使是模型,我们也来品尝下吧。前边说的这五段demo对应了文心一言的五个使用场景,分别是:文学创作、商业文案创作、数理推算、中文理解、多模态生成。从表面上看,文言一心的内容生成方面的自然语言处理能力如果真如demo演示那样,倒也算是达到了常规水平,但其中还是让我们发现了一个有意思的地方。也就是在中文理解的介绍上,发布会直播中共提了四个问题,分别是:“洛阳纸贵是什么意思?”“当时的洛阳纸到底有多贵?”“这个成语在现在的经济学原理里,对应的理论是什么?”“用洛阳纸贵四个字写一首藏头诗”但是在后续的新闻稿截图中,第二个问题莫名消失,并且该题的答案替代了第一个问题的答案。如此诡异,不免让人怀疑这demo的真实性。没有现场演示,所谓的demo又出现这样的问题,作为用户,只能听一听现场李彦宏和王海峰的介绍了。关于文心一言,李彦宏在发布会坦言,大家难免会拿来与ChatGPT进行对比,这个门槛还是很高的。另外,从其本人在内测过程中体验到的文心一言的能力来说,确实并不完美。“并不完美”,是真正的不完美,还是不自信呢?也许很多人要问,既然不完美,为什么要现在发布呢?李彦宏也现场表示,是因为有市场需求。对于这样的回答,大家可以自己品一品。然后是在文心一言的技术方面。王海峰介绍,文心一言是新一代知识增强大语言模型,是在ERNIE、PLATO系列模型的基础上研发的。其关键技术包括:监督精调、人类反馈的强化学习、提示、知识增强、检索增强和对话增强。我们知道,对于生成式AI产品来说,人类反馈的强化学习是技术中至关重要的一个,但现场王海峰表示,文言一心在该方面的训练不够充分,需要在后续的应用中优化。可以说这是坦诚,但也印证了不成熟的事实确确实实存在。一直以来,人们对百度的AI技术期望值较高,在ChatGPT大火后,百度首个宣称将推出“对标”产品“文心一言”。在多模态生成等方面,文言一心确实展示出可用性,虽然PPT确实有问题,但通过李彦宏与王海峰的介绍不难发现,文言一心并不成熟,此时发布也是与市场需求有关。有人将李彦宏口中所谓的“市场需求”作为解释,大概意思是:ChatGPT的发布对搜索引擎冲击最大,百度必须尽快发布类ChatGPT产品,即使是搜索引擎套个壳子,也要硬着头皮上。因为用户只要用百度的产品提问和搜索,百度都有机会把流量变成金钱。这次发布会上,李彦宏也宣布已经有650家生态伙伴接入文心一言。有网友调侃,文心一言有没有和6.5万莆田医院签约?巧合的是,在文言一心发布前一天,GPT-4突然发布, 强大的识图能力,更高的回答准确性都将让升级了GPT-4的ChatGPT更加强大,这不免刺痛了国内用户的心!希望越大,失望越大。对百度文言一心有高期待的用户可能看过这场发布会后真的要失望了,甚至发布会结束普通用户还无法体验,这更难让人接受。所以,在发布会刚开始没多久,百度港股变出现直线下跌,最高跌幅超过10%。只想跟百度说,赶超ChatGPT需要做的着实还有很多,而对于用户,希望百度能拿出更多的诚意! |