• 最新
谷歌申请使用语言模型从查询中生成检索词元专利,用于训练大型语言模型(LLM)以预测公共查询的泛化

来源:金融界 ...专利摘要显示,方法、系统和设备,包括在计算机存储介质上编码的计算机程序,用于训练大型语言模型(LLM)以预测公共查询的泛化。然后使用所述泛化来生成用于注释所述公共查询的检索词元。本文源自:金融界

AI新突破:简化推理路径,大型语言模型准确率飙升34.5%

近期,一项由me ta的FAIR团队携手耶路撒冷希伯来大学的研究人员共同发表的研究,为大型语言模型在复杂推理任务中的表现带来了新的突破。研究揭示了一个出人意料的结论:简化推理链条,竟然能够显著提升AI模型的准确率,提升...

大型语言模型:并非真正推理,只是在“找关系”数学|原理|因果关系_网易订阅

随着人工智能技术的飞速发展,大型语言模型(比如我们熟悉的ChatGPT)已经成为了人们生活和工作中不可或缺的工具。这些模型能够生成各种各样的文本,从回答问题到创作故事,似乎无所不能。然而,最近一项由亚利桑那州立大学...

英矽智能申请统一文本和点云分子输入的大型语言模型专利,文本输出模块被配置为以行表示法格式输出分子数据

变换器模型体系结构包括点云输入模块、文本输入模块、与点云输入模块操作地耦合的点云编码器模块、与文本输入模块和点云编码器模块操作地耦合并且被配置为从其接收数据的大型语言模型模块、以及与大型语言模型模块操作地耦合的...

哈尔滨能创数字申请基于大型语言模型结合数字孪生的报告自动化生成系统及方法专利,可直接进行文本总结

本文源自:金融界金融界2025年5月31日消息,国家知识产权局信息显示,哈尔滨能创数字科技有限公司申请一项名为“基于大型语言模型结合数字孪生.

航天物联网等取得基于大型语言模型的会议纪要生成方法专利

航天物联网等取得基于大型语言模型的会议纪要生成方法专利,专利,大数据,语言模型,中国航天,航天物联网,技术有限公司

基于图神经网络的自然语言处理:融合LangGraph与大型概念模型的情感分析实践

与基于词汇分割的大型语言模型不同,LCMs在语言无关和模态无关的抽象表示空间中运行,能够直接处理完整的句子或语音话语单元。这种架构设计使得模型能够在更高层次上理解和生成语言内容,类似于先构建叙事框架再填充具体细节的...

重新思考大型语言模型推理的采样标准:基于能力-难度对齐的视角

在人工智能快速发展的今天,大型语言模型(LLMs)在数学等具有挑战性的任务中展现出了令人惊叹的表现。2025年5月,来自美团集团和北京大学国家软件工程研究中心的研究团队联合发表了一篇题为《重新思考大型语言模型推理的采样...

利用大型语言模型简化出院小结并提供心脏病学生活方式建议

推荐 为解决出院小结复杂难懂且缺乏个性化生活方式建议的问题,研究人员开展了一项研究,探索使用大型语言模型(LLM)来简化出院小结并生成相关建议。结果显示,LLM生成的总结显著提高了可读性,并得到了医疗专家的高度评价,...

LLaDA 1.5:为大型语言扩散模型带来方差减少的偏好优化

我们平时使用的大型语言模型,如ChatGPT等,大多采用自回归(Autoregressive Models,简称ARMs)架构,就像写文章一样,一个词接一个词地生成。而近年来,一种名为掩码扩散模型(Masked Diffusion Models,简称MDMs)的新型...

相关阅读