微软将开源数据集 提高机器的阅读理解能力

  发布时间:2025-11-05 08:42:28   作者:玩站小弟   我要评论
据外媒报道,微软将发布免费的数据集来帮助机器创建更多的对话。该数据集名为微软机器阅读理解数据集(简称MS MARCO),包含有10万条英文查询及对应回答。用来帮助人工智能系统更好地理解人类语言。微软合 。

据外媒报道,微软微软将发布免费的将开据集机器解数据集来帮助机器创建更多的对话。

该数据集名为微软机器阅读理解数据集(简称MS MARCO),源数包含有10万条英文查询及对应回答。提高用来帮助人工智能系统更好地理解人类语言。阅读理

微软合作伙伴集团项目经理Rangan Majumder在周五的微软一篇博客中提到,微软将免费开放MS MARCO,将开据集机器解并希望能够与其他机构合作来更好地提高机器的源数阅读理解能力。

数据集中的提高资料来源于必应搜索和Cortana,并做相应的阅读理匿名处理。对问题的微软回答则是基于互联网、服务器托管人类手工编写以及经过验证的将开据集机器解信息。这些查询和回复将用于建立深度学习模型。源数

当前,提高该数据集将对非商业用途的阅读理用户提供免费下载。同其他人工智能数据集开源计划类似,微软也将采用同样的方式开源MS MARCO。

其中的一项是ImageNet,可用于训练图像识别算法的图片标记数据库。微软此前在开发图片识别技术时用到ImageNet,现在又用该数据库来强化微软计算机视觉API等产品。如果想了解更多有关MS MARCO的信息,企商汇可下载其研发团队发表的论文。该团队还在进行另外一项挑战,用MARCO的数据来评估训练模型,而评估脚本也还在研发中。

这项开源计划也是微软进一步发展其人工智能的举重要措。微软一直以来都在打造基于机器学习和人工智能的Azure云平台,同时在Office和Windows中也加入了一些人工智能的特性。本周早些时候,微软推出了QnA Maker云服务,用于降低开发者研制问答聊天机器人的难度。

  • Tag:

相关文章

  • 华硕A4417500性能评测(华硕A4417500处理器的强大性能表现)

    摘要:随着科技的不断进步,电脑的性能也越来越强大。华硕作为一家知名电子产品制造商,推出了一系列高性能的产品。本文将以华硕A4417500处理器为主题,深入评测其性能和表现。一、华...
    2025-11-05
  • 如何选择域名新后缀?有什么技巧?

    如何选择域名新后缀?有什么技巧?随着.com/net/cn等主流后缀域名资源的枯竭,新的顶级域名确实成为了新一代域名投资者和终端眼中有待挖掘的“金矿”。然而,新的顶级域名类别繁多,如果盲目随机投资不仅
    2025-11-05
  • 域名后缀vip代表什么?vip域名后缀怎么竞价?

    域名后缀vip代表什么?vip域名后缀怎么竞价?vip域名后缀竞价与竞价交易,实行最高竞价原则。当前用户成功订阅vip域名后,系统会显示当前域名的用户数量,方便用户评估当前域名竞争的激烈程度。如果一个
    2025-11-05
  • 域名vip什么意思?如何购买.vip域名?

    域名vip什么意思?如何购买.vip域名?.vip域名将于5月份在全球注册。这个域名引起了很多人的关注,很多稻农都争先恐后地注册了这个域名。那么,如何购买.vip域名呢?购买.vip域名可分为预先注册
    2025-11-05
  • 制作启动盘的完整教程(一步步教你如何制作启动盘)

    摘要:启动盘是一种非常有用的工具,可以帮助我们解决电脑系统崩溃、病毒感染等问题。然而,很多人并不知道如何制作启动盘,因此本文将为大家详细介绍以启动盘复制为主题的完整教程。选择适合...
    2025-11-05
  • TIOBE 6 月榜单:C++ 即将超越 Java

    TIOBE 公布了 2022年 6 月的编程语言排行榜。上月榜单内容曾指出,C# 和 C++ 将有望取代 C 进入 Top 3;时至本月,榜单头条信息则是C++ 即将超越 Java,进入榜单前三。TI
    2025-11-05

最新评论