暂无
AIGC热潮下,数据重要性愈发凸显。以ChatGPT为首的人工智能,由庞大数据集训练而成。如今,已有公司“揭竿而起”要求收费,不再甘于被微软、谷歌等科技巨头免费用数据。
4月18日,美国知名论坛社交平台Reddit宣布,计划向通过其API使用数据的公司收费。目前,谷歌、OpenAI和微软等公司正使用Reddit平台上的用户对话语料训练AI大语言模型,包括OpenAI的ChatGPT和谷歌的Bard模型均有使用。Reddit表示,API访问收费的细节仍在敲定,价格预计在未来几周内公布。
业内人士认为,Reddit对其聊天数据进行收费是行业发展趋势,将对上游数据资源方以及AI大模型厂商带来深远影响,毫无疑问,手握版权、数据、IP等优质资产的公司有望成为人工智能时代的“锂矿”。中文在线曾在互动平台表示,国内多家模型公司就采购公司中文数据正在进行合作磋商。
此外,中文在线昨日在回复深交所的公告中称,人工智能时代,数据将成为最重要的生产资料,公司深耕行业多年积累了海量正版的数据资源,以及成熟的知识产权保护链,这能够在最大程度上保证AIGC获取数据、生成内容、产品商业化应用的准确性、稀缺性和合规性。公司千亿级正版高质量中文语料数据库资源优势,以及持续生产内容的能力、编辑能力,可为AI大模型训练提供高质量中文数据生产要素。