2023年3月16日下午2点,李彦宏在百度总部发布厅为大家揭开了备受期待的产品——文心一言。作为百度的创始人,李彦宏此前多次站在聚光灯下,但这次发布会上,他的神态透露出一丝紧张和不安。对于这款被寄予厚望的产品,人们充满了期待,却也抱着一定的好奇心,想要看看它是否能够胜任所承诺的功能。
然而,遗憾的是,这次发布会上展示的素材都是预先录制的,并没有现场实际操作。这让许多人对文心一言的真正能力仍持有质疑态度。
幸运的是,差评君获得了内测账号,亲自对文心一言进行了测试,并与搭载GPT-4的New Bing进行了比较,以探究它们的强大之处。
首先,我们对文心一言进行了一些常见问题的测试。比如,如何制作美味的松鼠桂鱼。文心一言给出了详细的步骤和注意事项,而New Bing的回答则稍显简略。虽然我们无法亲自品尝两个版本的菜谱,但可以看出百度文心一言的回答更加贴合标准菜谱,提供了更完整的信息。
接下来,我们测试了它们的编码能力,要求它们为渐变色按钮生成CSS代码。文心一言提供的代码能够运行,但它对于”渐变色”的理解却有误。相比之下,New Bing成功理解了渐变色的要求,并提供了准确的代码。这让我们感受到文心一言更注重完成用户指令,而New Bing则带有一些炫技的倾向,提供了完整的代码和”点击我”的提示。
我们还测试了它们理解中文互联网黑话的能力。令人失望的是,文心一言在这方面的表现不如New Bing。比如在”鸡你太美”的梗上,它未能给出令人满意的答复,而New Bing虽然也有错误,但更接近正确答案。此外,在”差评925″的梗上,文心一言由于受限于训练语料,未能给出预期的答案,而New Bing则更准确地解释了该梗。
最后,我们测试了文心一言独有的绘图能力。我们要求它生成一只刺猬敲击键盘的图像,效果相当不错。然而,当我们要求它生成一幅小马拉大车的图片时,结果却是一辆真实的马车。尽管如此,这次测试依然展示了文心一言在图像生成领域的潜力。
然而,自文心一言发布以来,互联网上对它的评论带着一丝嘲讽的味道。有人在微信群中传播嘲笑表情包,还有以聊天记录形式的段子,提到如果文心一言无法正确回答,就让员工替代它。发布会的直播间里充斥着质疑和嘲笑的弹幕。
在这个测试中,文心一言表现得有些像一个缺乏自信的孩子,无论回答如何,只要受到否定,它就会不断承认错误,并承诺会变得更好,只需要给予时间。
我认为,百度此次的勇气值得赞扬。尽管其他公司也声称推出类似的产品,但百度仍然勇敢地推出了文心一言。作为一个以搜索引擎为主业的公司,百度可能会通过文心一言颠覆自身的核心业务。传统搜索引擎及其广告模式可能会被类似产品所取代。百度的举动充满了激流勇进的气息。
总之,或许我们应该保持一些耐心,给予这个初出茅庐的产品更多的时间。谁知道呢,也许某一天,它会突然展现出色的表现。在技术不断演进和创新的世界,一切皆有可能。
暂无评论内容