行业资讯 分类
深数所发布50XK星空体育0个行业多模态算料集

  在日前举办的“数·算·网”融合发展暨粤港澳大湾区(南山·前海)算力服务联盟第一期交流研讨会上,深圳数据交易所(以下简称“深数所”)发布了500个垂直行业多模态算料集,按照大模型应用的不同阶段(训练、推理、调优),有的放矢地提供数据源,让国产大模型厂商“寻数有路”。

  此次深数所发布的首批500个人工智能大模型高质量训练数据集,由37家不同的数据商提供,涵盖12个“数据要素×”领域,3家境外数据商,7类数据模态(文本、图像、音频、视频、多模态、3D、GIS等)。且本批数据集首次汇聚了来自中国气象局、中国知网、中译语通、万邦同和、微梦数据(新浪微博)、前海数据、海天瑞声、拓尔思、数据堂、智慧芽、网智天元XK星空体育、柏川数据、深信科技等数据商的数据集作为大模型算料。其中大部分算料为全国首发。

  深数所人工智能行业有关人士表示,数据作为一个高效的“乘法”因子,能够与不同行业结合,显著提升行业的生产效率或创新能力,而人工智能技术则通过“加法”方式为传统产业带来渐进式的改进和优化,两者相互交织,共同成为数字经济发展的双翼。

  “数据都是零散的,国产大模型厂商无法实现批量采集数据,我们此次推出的算料集就是,将大模型需要的训练数据进行逻辑的汇聚,从而形成了一个大模型训练数据产业高地。”深数所人工智能行业有关人士告诉记者,目前,人工智能和数字经济的领域存在数据荒的问题,特别是在多模态数据、中文数据、中国文化、中国价值观数据等领域,深数所按照大模型应用的不同阶段(训练、推理、调优)提供数据源,让国产大模型厂商“寻数有路”。(记者 邹媛)

  更多精彩资讯请在应用市场下载“央广网”客户端。欢迎提供新闻线小时报料热线;消费者也可通过央广网“啄木鸟消费者投诉平台”线上投诉。版权声明:本文章版权归属央广网所有,未经授权不得转载。转载请联系:,不尊重原创的行为我们将追究责任XK星空体育。

  特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

  一地前首富宣告破产!名下公司账户仅剩371元,还有8.74亿元违约债券未清偿……

  秦皇岛一船只侧翻致12死6失联,当日游客:没看到船上有救生衣,差一点就上了船

  EKWB新款AIO水冷散热器专为英特尔12/13/14代酷睿开盖处理器设计

  买大浪费!苹果高管重申8GB版MacBook新品:非常合适 等于别人16G

  星空体育

  星空体育

  星空体育

Copyright © 2012-2024 北京汇医善济医疗科技服务有限公司 版权所有 非商用版本网站地图txt地图

京ICP备2021018530号