科大讯飞获4家机构调研:多模态能力是实现通用人工智能的必经之路,也是科大讯飞既定的人工智能技术长期战

文章正文
发布时间:2024-05-20 02:51

  科大讯飞(002230)5月16日发布投资者关系活动记录表,真空机公司于2024年5月16日接受4家机构调研,机构类型为保险公司、基金公司、证券公司。 投资者关系活动主要内容介绍:

  问:最近OpenAI发布了GPT-4o这一端到端多模态大模型,请问公司在多模态大模型上有哪些进展

  答:多模态能力是实现通用人工智能的必经之路,也是科大讯飞既定的人工智能技术长期战略,已广泛应用在教育、医疗、工业、汽车、机器人等领域。 1、2022年初,讯飞发布了“多模感知、深度理解、多维表达、运动智能”等多项核心能力的“讯飞超脑2030计划”,致力于让懂知识、善学习、能进化的服务机器人走进每个家庭。近3年,科大讯飞在多模态领域获得了17个国际权威评测冠军。 2、2023年8月15日,在讯飞星火大模型V2.0发布会上,讯飞发布了讯飞星火大模型的多模态能力,实现了图像描述、图像问答、识图创作、文图生成、虚拟人合成等方面全新升级,在业内大模型中明显领先。 3、2024年1月30日,讯飞发布了星火语音大模型,中文、英语、法语、俄语等首批37个主流语种语音识别效果超过OpenAIWhisperV3;在多语种语音合成方面,星火语音大模型的首批40个语种拟人度超83%,继续保持全球领先。此外,讯飞星火的超拟人对话实现了全语音自然交互,让语音合成有内容、有语种、有韵律、有音色、有情绪,合成效果超越了GPT-4turbo。 讯飞星火V3.5在语义理解、指令跟随、多轮对话、情绪感知、拟人合成等能力的出色表现,带来了语音技术发展和人机交互体验提升的全新机会:讯飞翻译机上线了语音大模型技术,其中,多语种自动识别支持35种语言,增强式翻译技术提供中英双语服务,让翻译机化身AI翻译助手,让跨语言交流更加便捷省心;此外,星火语音大模型还将为汽车、客服、家庭、陪伴机器人等场景带来人机交互变革。 4、4月26日,首个支持“长文本、长图文、长语音”讯飞星火V3.5正式上新。首发“多情感超拟人合成”和“一句话声音复刻”,实现了更生动、更具个性化的表达,带来更有温度的人工智能体验。超拟人合成的情绪表达可感知度已达到85%以上,高兴、抱歉、安慰、困惑等语气表达比原来更加生动,可以满足用户在各种场景下的自我减压需求。此外,首发讯飞星火图文识别大模型,覆盖31个场景、18种版面要素,不仅可以处理插图、公式、二维码、表格等非常复杂的版面分析,结合篇章的语义使得文字理解能力进一步提升,而且覆盖了更多 专用领域的特殊的专业符号。 大模型多模态研发当前正在快速推进,公司力争今年实现在现有版本基础上再上一个大的台阶,保持行业领先水平。

  问:搭载讯飞星火大模型后,讯飞AI学习机的增长情况如何

  答:2023年,讯飞A1学习机高端学习机市占率、线上销售额均保持市场第一,用户净推荐值NPS持续保持行业第一,今年一季度学习机销量增长超过100%,延续了去年的增长趋势。 2、2023年5月,科大讯飞推出全球首款搭载认知大模型的AI学习机,逐步推出了8项大模型功能特性(英语口语陪练、中英作文批改、数学互动辅学、智能编程助手、创意绘画伙伴、百科自由问答、亲子教育助手、英语答疑辅学),快速将大模型技术优势转换为产品功能特性并形成市场竞争力,用户体验进一步改善。 3、2024年,讯飞AI学习机将持续强化和稳固高端品牌的定位,通过星火大模型打造的“1对1类人辅学”和“个性化精准学”两大差异化优势,持续实现因材施教、省时提效的个性化教育理念。

  问:智能汽车业务快速增长的动力来源是什么,以及如何看待大模型在车载场景的落地进展

  答:2023年,中国汽车产业链实现了高质量的发展:中国汽车工业协会数据显示,2023年我国汽车产销规模首次双双突破3000万辆,中国汽车出口491 万辆,同比增长57.9%,首次跃居全球第一;中汽协数据显示,2023年,我国新能源汽车产销量均超过940万辆,市场占有率超过31%。 2、2023年,讯飞智能汽车业务2023年营收接近7个亿,同比增长近50%。当前已覆盖50+车企,累计合作车型超过1400款,累计出货量逾5360万套,月均活跃用户超2500万,车载语音市场占有率持续保持第一。 3、在大模型产品的车载应用上,公司先后于2023年5月、10月发布了基于讯飞星火认知大模型的汽车应用成果,并同步全面升级了智能交互、智能音效、智能座舱等全线产品解决方案。 2024年4月,科大讯飞与奇瑞联合打造的LionAI大模型和LionMelody沉浸移动音乐厅在星途汽车中全新上线,为用户带来更优质的交互体验和车内听感。LionAI全场景语音助手能实现毫秒级唤醒应答,人车交互不再拘束于定制的指令性话术,车辆使用、生活、情感、百科等各种问题随时提问、有问必答,合成应答媲美真人发音。LionMelody沉浸移动音乐厅通过科大讯飞高阶音效算法,为用户呈现更智能、更高品质的车内听觉体验。 4、随着全球汽车市场对智能化诉求的日益增长及中国汽车出口的高速发展,公司加快全球化业务的布局拓展,以多语种交互技术支撑客户出海战略。当前讯飞汽车交互产品已支持超过20种海外语言,覆盖上汽等头部车企的数十款海外车型,在欧洲、南美、东南亚等多个地区实现了量产,为全球用户提供先进的智能语音服务。

  问:请问智慧医疗C端业务当前都有哪些代表性产品,进展如何

  答:2022年科大讯飞发布了智能助听器,同年推出性能升级的尊享版,以良好的性能、智能化的体验、亲民的价格,得到市场和消费者的充分认可,在2023年中国两大电商平台京东及天猫“618购物节”的同类产品中收入排名第一。2024年4月7日焕新推出智能耳背式助听器,在降噪和增强人声方面双管齐下,更好地满足极重度听损人群的需求。 2、2023年10月,公司推出了“讯飞晓医”APP及小程序,以满足患者及居民诊前、诊中、诊后三大阶段的问诊需求。患者诊前问询功能可大幅提升问诊效率。“讯飞晓医”APP及小程序亦支持规范用药,大幅减少潜在不合理用药。患者及居民还可使用“讯飞晓医”APP及小程序解读诊断和体检报告,根据报告生成健康提醒,并帮助患者找到正确的科室。

  问:大模型在金融行业有哪些典型应用场景和案例

  答:在金融行业,科大讯飞与人保集团联合发布了人保首个百亿级参数的专属问答领域大模型“人保大模型”,被《金融电子化》评为“2023金融信息化10件大事”之一;与交通银行建设联合创新实验室,共同探索星火金融大模型在客户服务、营销展业、软件研发、中台运营、人机协同、APP交互等场景中的落地应用。

  问:请介绍讯飞星火大模型代码能力落地的应用案例

  答:在软件等IT行业,科大讯飞的AI程序员不仅在公司内部使用,而且已经在软通动力(301236)、交通银行等100多家企业“上岗”,它不仅能够理解复杂的编程逻辑,还能自动生成高质量的代码,帮助开发人员提升代码开发效率,加速 数字世界的构建。 2、在高等教育领域,2023年9月上线的北京邮电大学“码上——大模型赋能的智能编程教学应用平台”为学生、教师和学校提供编程辅导、教学支持和教学管理服务,有效支撑学校有组织编程教学,近期成功入选教育部首批“人工智能+高等教育”应用场景典型案例。应用成效数据显示,“码上”对于占学生群体人数(80%)以上的编程新手的编程问题能够提供较高质量/准确率的辅导(修改后代码的运行成功率达60%—80%),显著减轻教师的辅导工作压力;

  调研参与机构详情如下:

参与单位名称参与单位类别参与人员姓名
博时基金   基金公司   于福江  
东吴证券   证券公司   王紫敬  
平安证券   证券公司   王佳一  
太平资产   保险公司   冯宝龙、汪腾