随着百度文心一言、阿里通义千问等众多大模型接连问世,国内的“百模之战”也进入了白热化的阶段。但截至目前,已经发布了大模型的互联网厂商,全都只是放出了部分内测名额,并未开启全民大模型时代。
(资料图片仅供参考)
那么,首个面向全体公众大规模开放的大模型,什么时候才会到来?
5月6日,科大讯飞发布了讯飞星火认知大模型—首个面向全体公众大规模开放的大模型,由科大讯飞董事长刘庆峰、科大讯飞研究院院长刘聪共同发布。
讯飞星火认知大模型,是首个在发布之前便宣布,在正式开放后仅需注册即可体验、面向所有民众开放的大模型。
在会上,讯飞AI学习机、讯飞听见、讯飞智能办公本、讯飞智慧驾舱、讯飞开放平台等接入星火大模型的5项应用成果也完成了同步发布。
那么,科大讯飞的星火认知大模型实力究竟几何?在其背后有着哪些的技术支持?而在快速实现落地应用的侧面,又体现出了科大讯飞怎样js的竞争优势呢?
本文将从讯飞星火认知大模型自身与最新发布的5项应用成果入手,剖析讯飞星火认知大模型背后的技术力与企业自身的产品力。
1
1个“通用智能”底座
N个“专用大模型”肆意生长
ChatGPT作为掀起AI浪潮的破圈明星产品,其缜密且快速的多轮会话能力,让人们为之惊叹。
而这,也导致了我们每次谈及国产大模型时,大语言模型总是大家绕不过去的那个坎,那么,星火的对话能力究竟如何?我问了它以下几个问题。
首先是语言理解相关的问题,毕竟,对于一个大语言模型来说,理解问题是解答问题的第一步。
第一个“意思意思”的问题,也是众多外国人在中国学习汉语时要迈过的一个门槛,而星火大模型则很好地分辨出了“意思”与“意思意思”的区别,并做出了在不同场合中相关的解释;而第二个问题则是涉及了具体语境的不同语义的问题,星火也根据场合做出了正确的判断。
在语言理解之外,是否拥有连续对话能力与自我纠错能力,也成了区别众多语言大模型较为重要的一个标准,所以我问了星火一个十分莫名其妙的问题:诸葛亮为什么要投奔刘邦?
星火在得到问题后很快做出了回答,显然,它混淆了刘邦与刘备的概念。不过,在我提出纠错之后,星火快速发现了自己的错误,完成了改正,并且在接下来十几轮对话后仍然可以准确地指出“诸葛亮为什么投奔刘邦”这个问题的错误。
在本轮对话中,虽然星火并没有在第一时间发现问题中隐藏着的错误,但在我提出疑问之后可以快速完成纠错,表现出了极强的连续对话能力,让大模型“活”了起来。
而在语言理解能力、连续会话能力、自我纠错能力测试后,我还测试了星火大模型的文本生成能力,其在中英文领域都表现出了极强的创造力,并且在面对相同的问题时,还可以给出许多不同但都符合要求的回答。
而在通用的对话领编程客栈域之外的专业领域,星火大模型也可以很好地完成回答。
在面对我提出的第一个问题,星火较为专业地进行了解答,而第二个问题星火虽然没有给出具体的资产配置建议,但需要注意的重点星火都有提及,在实际生产生活中完全可以起到抛砖引玉、定下基调的作用。
在以上的几个涉及语言理解、逻辑推理、文本生成与专业领域问题中,星火大模型都有着很好的表现。
也正如刘庆峰所介绍的,“星火的大语言模型是科大讯飞的行业专用系统通过独立、封闭环境训练语料得到的结果,可以避免一本正经回复错误消息,使得专用领域保障性更强。”
而这一切优秀的表现,除了讯飞有着成建制的团队与多年的AI技术积累外,与星火大模型自项目开发之初便采用了“1+N”的架构不无关系。
其中,“1”是通用认知智能大模型算法研发及高效训练底座平台,而“N”则是应用于教育、医疗、人机交互、办公等多个领域的专用大模型。
“1+N”模式显著提高了认知大模型在细分领域的实用性,也意味着“星火”在行业中的“泛用性”很高,在“通用智能”与“专用大模型”相辅相成中,能够在许多细分领域内提供实用的帮助,惠及众多行业的无数从业者,共同享受技术突破带来的红利,完成合作共赢。
科大讯飞总裁吴晓如也曾表示,“我们有信心达到国内认知大模型中技术领先,同时在教育、医疗等行业中率先深度应用。认知大模型也将广泛赋能开放平台合作伙伴,带来互联网产业格局重塑的新机遇”。
这赋能千行百业的底气,则来自于科大讯飞在AI行业与各应用细分行业中多年的深耕。而核心算法、私域数据保有量和算力作为撑起星火大模型的三根支柱,起到了极为重要的作用。
核心算法方面,讯飞在Transformer深度神经网络算法方面拥有丰富经验,而对话AI便主要涉及到了自然语言处理相关技术,属于认知智能领域的应用之一,多年积累的经验,也让星火得以快速成长起来。
此外,在2022年,科大讯飞也累计获得了常识阅读理解挑战赛OpenBookQA等13项世界冠军;开源了超过40个通用领域、6个大类的系列中文预训练语言模型,成为业界最广泛流行的中文预训练模型系列之一。
数据积累方面,科大讯飞业务早已延伸至教育、医疗等领域并在其中深耕多年,拥有众多核心场景的数据优势。
而在算力、算法难以被拉开差距的当下,私域数据保有量与质量成为了最能拉开大模型间差距的指标,如此优质且大量的私域数据,也有望助力星火成为各专业领域中最优质的大模型。
而在算力方面,科android大讯飞依托国家新一代人工智能开放创新平台、认知智能全国重点实验室与语音及语言信息处理国家工程研究中心三大国家级平台,为讯飞星火大模型的攻关计划服务。
同时,科大讯飞自建有业界一流的AI数据中心,完成了基于国产AI芯片的国产软硬件适配,为大模型训练平台建设奠定了很好的硬件基石。
此外,在工程技术方面,讯飞实现了百亿参数大模型推理效率的近千倍加速,为未来更大更多认知智能大模型技术经济实惠规模化应用提供了可能。
2
星火,打响大模型产品化第一枪?
在ChatGPT掀起AI浪潮后,许多与AI有沾边但没有真正实力的公司,都在蹭热点来做大模型,出现了所谓的“百模大战”、“百模之争”。
但事实上,想要研发一个成熟的大模型项目并非一场儿戏。相反,大模型级别项目的研发与应用,需要整个公司多年于AI行业的深耕积累和企业上下的倾力支持。
而在大模型层面的技术问题解决后,距离真正的应用仍有很长的路要走。
想要让其真正服务于生产与生活,最重要的、也离不开的一步则是最终端应用的产品化,这就对公司的产品化能力提出了新的要求,而科大讯飞作为有着十多年AI技术产品化经验的“老将”,较同行有着极大的优势。
而就在星火大模型发布会上,讯飞也同步发布了讯飞AI学习机、讯飞听见、讯飞智能办公本、讯飞智慧驾舱、讯飞开放平台5项应用成果,打响了大模型应用化的第一枪。
科大讯飞学习机一直代表着最新一代人工智能学习机,可以为教师、同学提供一套科学有效、已验证的智慧学习方法,并通过人工智能+教育大数据技术,实现全面检测知识点,追根溯源找弱项,针对弱项精准学的独特功能,以解决中小学生学习效率低、成绩提升慢的问题。
而在发布会当日,编程客栈讯飞也发布了搭载全球首款搭造大模型的最新一代学习机——科大讯飞AI学习机T20,在搭载大模型后,学习机的语言学习能力再次迎来升级。
以作文的辅助提升为例,在现实中,一位同学想要拥有长期针对性的批改指导无异于痴人说梦,但搭载星火大模型的AI学习机则借助最新的专用领域AI,拥有了作文深度理解能力与评语和范文生成能力,为作者提供基础批改、高级批改、提升建议与优化参考的功能。
而在英文作文的批改上,讯飞AI学习机也有着极强的能力,不仅能找出词汇、语法问题,而且还能更深入地分析句型结构来更好地改进作文。
此外,在口语训练上,AI学习机还能充当一名口语对练者,与学生进行类人的实时外语对话,并进行发音评测,帮助英语学习者摆脱“哑巴英语”的困境。
而这只是大模型在教育领域的第一次亮相,但或许就在不久的将来,当AI深度渗透教育行业后,考试等考核方式也将被AI大数据挖掘所替代,有望对教育产生革命性变化,讯飞也有望迎来AI+教育赛道上的又一次腾飞。
继AI学习机亮相后,搭载星火大模型的讯飞智能办公本、智能录音笔、智能麦克风与讯飞听见也相继迎来了展示。
在搭载讯飞星火认知大模型后,讯飞旗下的相关产品、应用便拥有了会议纪要能力、语言规整能力与一键成稿的能力。
使用者可以不再辛苦去录音、整理,而是通过讯飞产品将一大段录音一键轻松转成文字,并转为会议纪要;也可以利用规整细节功能,将口水稿变成更加容易阅读的书面语,进行语篇整理;还可以针对语音、文字等多模态素材一键成稿,智能生成。大幅减少了繁杂无谓的工作,极大地帮助了工作者提高效率。
而在教育与办公领域之外,讯飞还发布了汽车智能座舱、医疗、金融等应用了星火大模型的产品,展现出了强大的智能化水平与应用实力。
总而言之,讯飞的星火大模型已经广泛应用于各个领域,即将为人们的工作和生活带来更加便捷和智能的体验。随着技术的不断发展和完善,我们相信讯飞的星火大模型将会在未来发挥越来越重要的作用。
3
写在最后
与众多“赶鸭子上架”的大模型不同,讯飞星火大模型反而更像一款“十年磨一剑”的产品,从官网改版、到公关稿、到组织调研、再到公众号每天倒计时提醒.....每一处细节,都告诉我们,讯飞星火准备好了。
从产业经济以往的发展历程来看,每一次由技术革新引发的行业重塑,都必然带来新的机遇。而这一次,星火认知大模型全面布局所带来的重塑,同样将为行业参与者们,拓展出以前无法想象的新空间。
星星之火,可以燎原。可以说,星火AI大模型即将成为大模型赛道中为数不多的又一位有力竞争者。
伴随着科大讯飞“1+N”的结构在更多行业完成布局与落地后,也必将为从业者们提供更多帮助。而在这个过程中,讯飞也将伴随我们一同成长,再次筑宽企业护城河,勇争行业龙头!
标签: