• 最新
阿里Qwen3新模型开源,全面升级多语言文本表征与排序能力

Embedding系列模型,这一系列模型专注于文本表征、检索与排序任务,是基于Qwen3基础模型深度训练而来。...这一特性使得该系列模型在多语言场景下具备强大的处理能力,无论是多语言文本检索还是跨语言文本匹配,都能表现出色。...

语言神经元视角:对齐方式如何增强大语言模型的多语言能力?

研究人员们一直在尝试各种方法提升模型的多语言能力。最直接的方法是在预训练阶段增加非英语文本的比例,或者进行多语言持续预训练。这就像让一个人浸泡在多语言环境中学习。但这些方法往往需要大量的计算资源和多语言数据,就...

在经济问题上进行后训练,让大语言模型产生战略性泛化能力

这项研究探索了如何通过后训练技术,让大语言模型(LLM)像经济学家一样思考,从而展现出在多智能体系统中的战略性泛化能力。在人工智能研究的浪潮中,大语言模型(LLM)已经从简单的文本生成工具,发展到能够在数学和编程等...

大米和小米推出基于大语言模型全面测评儿童语言能力AI工具

大米和小米推出基于大语言模型全面测评儿童语言能力AI工具 当3岁的文文对着手机屏幕吱吱呀呀...这是国内首款专为1-12岁儿童打造的基于大语言模型全面测评儿童语言言语能力AI工具,家长孩子足不出户,就可以获得一份专业评估报告。...

SRPO:强化学习让多模态大语言模型推理能力更上一层楼

SRPO框架通过系统地生成高质量的反思训练数据并设计专门的奖励机制来鼓励有效的自我反思,成功地增强了多模态大语言模型的推理能力。归根结底,SRPO的成功告诉我们,为AI提供反思能力不仅可以帮助它们纠正错误,还可以使它们的...

西湖大学团队打造更高效的大语言模型训练方式

该论文于2025年6月1日发布在arXiv预印本平台上(arXiv:2506.01049v1),为大语言模型的训练优化提供了一种全新思路。一、大型语言模型的训练难题与传统解决方案 想象一下,你是一位教育者,面对一个有着数千名学生的超大班级。...

低秩矩阵揭示真相:利用主要权重提升大语言模型的推理能力

大语言模型(LLM)的训练也面临类似问题。当研究人员想要提升模型的推理能力时,是否需要调整模型中所有的参数,还是只需要找到并调整那些真正...这就像是比较运动员训练前后肌肉结构的变化,以了解训练如何改变了运动员的能力。...

2025年空中乘务专业要求:身高、学历及语言能力标准

今天咱们就掰开揉碎了说,重点聊聊身高、学历和语言能力这三个最关键的空中乘务专业要求。...去年刚毕业的王雅婷学姐分享:\

小鹏汽车申请车辆语音交互大语言模型相关专利,提升大语言模型理解能力

如此,根据生成的第一训练数据对基座模型进行增量预训练,提升大语言模型理解能力,使模型无需标注数据,也能准确地理解用户指令为用户提供智能便捷的交互体验,从而降低模型训练的成本。本文源自:金融界

语言能力与情商也很重要!杨瀚森若真进NBA,要吸取阿联周琦教训

前青岛外援里斯一直给开拓者管理层推荐杨瀚森,在试训结束后,开拓者队记Victor Sun也透露,试训验证了杨瀚森上升的行情,但他的语言能力还需要提升。鉴于此前在美特训期间,杨瀚森能够主动和训练师还有和自己一同特训的球员...

相关阅读