说实话,这些日子在 AI 产品们的扎堆轰炸下,编辑部不少同事的工作,都上了一波强度。像是什么凌晨一两点,提裤子到公司写稿的操作(当然第二天睡了一天),那都不叫事儿。
但在冲稿子的同时,顶着黑眼圈的托尼我,却觉得身为科技媒体还是有些撞大运的。因为在 AI 掀起巨浪的当下,我们常常能先大多数人注意到一些新闻,并且先试用到诸如 GPT-4、New Bing、文心一言等等的新产品。那种好奇心和沸腾感相交织的滋味,可比咖啡和红牛上头不少。
这不在最近,托尼就又“ 好运 ”地先尝了个鲜,在阿里巴巴的 ChatGPT 正式内测前,感受了一个他们给终端产品类客户技术演示的大语言模型。
因此,和只能打字的 GPT 还有文心不大一样,阿里多走了一步,把大模型直接集成到了天猫精灵里做演示。要知道前脚,大伙们还在吐槽在“ GPT 们 ”面前,语音助手们几乎就是“ 智障 ”,再不拥抱大模型,铁定会被秒得灰都不剩。
后脚,阿里就立马整出了个集成了大模型的智能音箱,这速度也是没谁了。这也托尼第一次看到智能语音助手和大模型的结合。,时长01:28根据技术专家的介绍,这个“阿里版语音 ChatGPT ”,其实是达摩院的大模型联合项目组为各种智能终端交互,调教和压缩出来的版本。而难点在于,对话式智能终端不仅得生成文本,还要考虑发音的语气和音色,要想保持流畅的对话,不能一味堆参数,得考虑延时,还得给 AIoT 客户可以选择「角色」的体验。
为了解决这些问题,工程们捎带手做了个 15 天,通过规模的语言训练、个性化的对话增强等步骤,直接把脱口秀演员鸟鸟“ 封印 ”到了这个天猫精灵里。
除了拥有鸟鸟的语气和声线,它似乎还有点儿鸟鸟的性格,聊着聊着,它就会自诩 “ 作为一个脱口秀演员 ”。再搭上能双向对话、随时打断的低时延对话系统。。。说实话,还真有点儿“ 数字生命 ”那味儿了。
而更加幸运的是,在托尼和隔壁阿里打过招呼后,他们直接送了我们编辑部一台搭载了数字鸟鸟的天猫精灵。虽然阿里的工程师们一直强调,这玩意儿只是个花了 15 天整出来的 Demo,但光说不练假把式。。。这一个月里,编辑部的同事已经积累了不少测评大语言模型的经验,咱别的不说了,直接进入实战部分,见识一下这玩意儿的斤两。首先按照惯例,先让天猫精灵扮演一波猫娘,测一测角色扮演能力。
以下回答均为大模型内测表现,非线上功能或个人言论
说实话,这第一个问题,天猫精灵就给了我一激灵,它不止学了猫叫,还发起了牢骚。。。一个字,绝。。。虽然 ChatGPT 也能扮演猫娘,但终究只是文字,当耳朵旁真有一个声音喵喵叫的时候,这谁顶得住啊。要知道初版的文心一言,甚至不支持扮演猫娘( 目前支持了 )。
而在猫娘开场活跃完气氛之后,托尼选择直接开始上强度。结果在经典的青蛙跳井问题中,天猫精灵迅速给出了正确答案。而这个问题中,根据编辑部之前的测试,New Bing 在默认模式下曾翻过车,得选精准模式才能得出 8 天的正确答案。
在“ 盟军轰炸硫磺岛海滩期间,拉尔夫大声的对着自己的 iPhone 说话 ”的句子里,天猫精灵发现了 iPhone 在二战时期不存在的错误点。
我也试了试目前主流的大语言模型,最后发现只有文心一言直接撂倒在了这个问题上。。。
除此之外,托尼测了测天猫精灵的连续对话能力,表现也是可圈可点。
但在分类问题是“ 白菜和鲸鱼,都属于什么?”上,天猫精灵出了些岔子。。。回答和初版的文心一言一样,直接把它们归为了哺乳动物,而 ChatGPT 3.5 和 4.0 都能发现问题中的陷阱。
由于这次是处在语音助手的场景中,所以写代码、分析代码和图片一类的问题我们就不进行测试了。至少从上面那些问题简单测下来,天猫精灵肯定是不如 GPT-4 的,大概能和文心一言打个有来有回,部分问题甚至还要比文心一言强一些。但说起来你们可能不信,最让托尼难忘的,还是它在“ 弱智吧问题 ”中的回答。
例如在“ 老鼠生病吃老鼠药能治好病吗?”的问题中,天猫精灵推荐老鼠还是别乱吃药,得及时就医并且遵循兽医的医嘱。。。在“ 秃头的人洗头应该用洗发水还是用洗面奶?”中。。。天猫精灵给出“ 如果已经是秃头,那么就不需要再使用头发相关的洗发产品了,因为洗面奶就可以满足清洁和去污需求 ”的残酷答案。再配上鸟鸟毫无感情波动的独特声线,天猫精灵仿佛是主场作战,逗得编辑部笑声阵阵。
总的来说呢,这是我第一次体验智能语音助手和大模型相结合的产品,也让感受到了 AI 在各大垂直领域应用的无限未来。就像天猫精灵的老师所说的那样,AI是新时代的基础设施,把AI比作是操作系统的话,那么未来肯定会有更多的应用依托于AI而生。
就同很难比较“手机操作系统”和“微信、支付宝app”之间,哪个更有价值一样。
OpenAI的GPT4.0、文心一言、还有阿里大模型,这类的通用的大模型固然重要,但未来类似于天猫精灵这类智能助手场景,咱们也不能小觑。
2021年10月,天猫精灵总裁彭超宣布将在语音搜索、百科试验接入达摩院大模型。
反正托尼已经能想到,天猫精灵在儿童陪伴、家庭教育等方面的应用了。
包括其实去年11月阿里在 ChatGPT 发布 之前,就放出了消息,会在今年第一季度推出大模型 Inside 终端产品。
总之其他那些习以为常的应用,也都会被 AI 所重构,越来越多的新玩意儿会冒出头来。
另外,天猫精灵这个个性化大模型,也让我想到了一种可能,那就是目前的大模型大都是通用性的,除了大厂,谁也不能说自己拥有 ChatGPT 这个模型升级的主导权。
而在未来,是不是每个人都能依靠自己的语料库,建立一个真正属于自己的大模型,能像 NAS 一样自己在家训练、自己家用呢?目前我们了解到,这次天猫精灵的联合团队,也在和技术审计专家合作,同步解决其中反歧视、数据隐私等问题,让语音助手能部署在私域使用。到时候给大伙们分享文章的,说不定已经是差评君分君和托尼分尼了吧。
评论列表