会员登录 - 用户注册 - 设为首页 - 加入收藏 - 网站地图 腾讯大模型技术斩获两项世界冠军,已落地微信搜索!

腾讯大模型技术斩获两项世界冠军,已落地微信搜索

时间:2023-06-03 22:46:49 来源:k频道最新在线网址 作者:休闲 阅读:751次

允中 发自 凹非寺

量子位 | 公众号 QbitAI

腾讯人狠话不多,腾讯大模型技术刚拿下两项世界冠军!大模

最近,型技项世5xsq在线视频视觉信息检索领域国际顶级学术会议WSDM(Web Search and Data Mining)宣布了WSDM CUP 2023竞赛成绩。术斩搜索

来自腾讯研究团队在无偏排序学习和互联网搜索预训练模型赛道上的获两两项任务中获得冠军。

ACM WSDM(Web Search and Data Mining) 会议是界冠军已信息检索领域顶级会议之一,由SIGIR、落地SIGKDD、微信SIGMOD和SIGWEB四个专委会协调筹办,腾讯在互联网搜索、大模5xsq在线视频视觉数据挖掘领域享有较高学术声誉。型技项世

WSDM Cup正是术斩搜索由WSDM会议举办。本届 WSDM Cup 共计400余支队伍参加,获两分别来自中国、界冠军已美国、落地新加坡、日本、印度等国家的知名高校和公司。

大赛共设置三个赛道:

无偏排序学习和互联网搜索预训练模型赛道(Unbiased Learning to Rank and Pre-training for Web Search);跨语言连续体的多语言信息检索赛道(Multilingual Information Retrieval Across a Continuum of Languages);视觉问答挑战赛道(Visual Question Answering Challenge)。

此次,腾讯机器学习搜索团队在第一个赛道的两项子任务中(Pre-training for Web Search和Unbiased Learning to Rank)获得冠军。

目前两项成果代码和论文均已发布到GitHub上。

两项任务冠军

深度学习领域,数据标注的质量对于模型的效果有着较为显著的影响。

但是较高的标注数据成本一直是研究团队的阻碍之一,如何从技术上利用无标注的数据训练模型自然成为了成为学术界和工业界关注的热点。

本次比赛,针对基于搜索的预训练任务(Pre-training for Web Search),腾讯团队通过大模型训练、用户行为特征去噪等方法,在点击日志上进行基于搜索排序的模型预训练,进而使模型有效地应用到下游相关性排序的检索任务。

通过预训练、模型微调、集成学习等多方面的优化,在人工标注的相关性排序任务上取得了较大的领先优势。

而在另一个赛道——无偏排序学习任务(Unbiased Learning to Rank)中,团队通过深入挖掘点击日志信息,充分利用包括文档媒体类型、文档展示高度和点击后的滑屏次数等特征对文档相关性进行无偏估计,提出了一种能够集成多种偏置因素的多特征集成模型,有效地提升了搜索引擎中文档排序的效果。

据了解,夺冠团队的成果均基于腾讯混元AI大模型(下文简称“HunYuan”)和太极机器学习平台实现。

目前,通过联合微信搜索团队,两项技术已经在微信搜一搜的多个场景落地相关技术,并取得了显著的效果提升。

2022年4月,腾讯首次对外披露HunYuan大模型研发进展——

HunYuan集CV、NLP、多模态理解能力于一体,先后在MSR-VTT、MSVD等五大权威数据集榜单中登顶,实现跨模态领域的大满贯。

2022年5月,更是在国际公认的CLUE三个榜单同时登顶,一举打破三项纪录。

现在,HunYuan又迎来全新进展,推出国内首个低成本、可落地的NLP万亿大模型,并再次登顶CLUE。

腾讯太极机器学习平台是集模型训练和在线推理于一身的高性能机器学习平台,具备万亿参数模型的训练和推理能力,为AI大模型预训练推理和应用落地提供了完整的端到端工程能力支撑,一站式解决算法工程师在 AI 应用过程中特征处理、模型训练、模型服务等工程问题。

腾讯长期致力于前沿搜索技术的研究,通过改进搜索算法,提升用户搜索体验,相关技术团队在检索预训练、大模型训练、搜索排序任务目标函数设计等方面的具有丰富的实践经验,研究成果多次在国际竞赛和学术会议中取得领先成绩,并广泛应用于微信搜索、腾讯广告、游戏等多个业务场景。

GitHub链接:https://github.com/lixsh6/tencent_wsdm_cup2023论文链接:https://arxiv.org/pdf/2302.13756.pdfhttps://arxiv.org/pdf/2302.13498.pdf

— 完 —

量子位 QbitAI · 头条号签约

关注我们,第一时间获知前沿科技动态

(责任编辑:综合)

相关内容
  • 搜狗智能录音笔C1体验:录音快速转文字,正确率高达95%
  • 中文知识图谱研讨会的学习总结  搜狗知立方
  • 一大波新词正在靠近 搜狗输入法喊你学习每日新知识
  • 让搜索更智慧 搜狗搜索知识图谱功能“一步”给你答案
  • 最高检通报全国未成年人检察社会支持体系示范建设工作情况
  • 冷知识:搜狗搜索居然把冷知识bot搬到了线下
  • 维基百科VS百度百科丨多角度对比分析
  • 招聘 | 太极、360、中电金信、联通数科、超图、小米
推荐内容
  • 谷歌加码人工智能,其母公司向AlphaSense注资1亿美元
  • 百度百科创建公司哪家好?自己申请百度百科很难通过审核
  • 今日头条上线“头条百科”   能改变搜索领域现有格局吗?
  • 【招商策略】ChatGPT成AI届“顶流”, 4680电池放量在即——全球产业趋势跟踪周报(0131)
  • 冒险搭载多轮语音交互的搜狗地图,能否从百度和高德的夹击中脱颖而出?
  • 太逼真!自然交互+知识计算,搜狗打造首款AI营养师赋能万亿大健康市场