训练大模型的数据或在2026年耗尽 数据源头公司深度受益于AI浪潮

最新信息

训练大模型的数据或在2026年耗尽 数据源头公司深度受益于AI浪潮
2023-08-29 07:44:00
超大模型依赖于海量的数据,研究机构Epoch AI认为,对数据需求急剧增加,以至于可用于训练的高质量文本可能会在2026年耗尽。
  人工智能模型的两个基本要素就是数据集和处理能力,系统在数据集上接受训练,模型通过处理能力检测这些数据集内外部之间的关系。在某种程度上,这两大基本要素可以相互替代:一个模型可以通过吸收更多数据或增加更多处理能力加以改进。然而,在专业人工智能芯片短缺的情况下,后者正变得越来越困难,这导致模型构建者加倍专注于寻找数据。东北证券分析称,在本轮AI浪潮下,叠加数据要素市场的快速变革,本身是数据源、或接近数据源的公司能够更好地使用AI创造出更大价值,成为AI新时代真正的受益者。
  据财联社主题库显示,相关上市公司中:
  中文在线拥有海量的正版中文数据资源,公司拥有网络原创驻站作者440余万名,超万亿字的中文文字资源。
  中信出版是全国优秀出版机构,拥有图书、报刊、电子、音像和网络出版及批发零售全牌照,主营图书出版与发行、数字阅读与服务业务和书店业务。
(文章来源:财联社)
免责申明: 本站部分内容转载自国内知名媒体,如有侵权请联系客服删除。

训练大模型的数据或在2026年耗尽 数据源头公司深度受益于AI浪潮

sitemap.xml sitemap2.xml sitemap3.xml sitemap4.xml