中原传媒
该集团的下属大象出版社与施普林格自然集团签署了中英文同步出版协议,该协议将成为中国第一家与Openal达成间接合作的出版社。
新华传媒
公司拥有财联、澎湃等30多个知名媒体平台,涵盖财经、民生、时政、教育等几乎所有领域。拥有全方位、全方位的优质语料库(免审)。
掌阅科技
该公司在文学和阅读领域的版权储备行业处于领先地位,这些中文语料可用于在线文本行业的垂直模型培训。
中文在线
公司深入从事文化数字产业,拥有大量正版中文数据资源,总数据超过60TB,各平台每天产生数亿文本内容。
读客文化
公司从国内原创小说开始,开辟了版权获取渠道,积累了高质量的作者团队,与包括世界四大版本在内的数十家版权代理公司保持了长期稳定的合作关系。
荣信文化
公司成功打造了一系列适合0-14岁中国儿童阅读的书籍,涵盖了儿童科普百科、卡通/漫画/绘本、儿童文学等多个儿童书籍领域。
视频语料:
中广天择
近日,公司与万兴天幕大模型签订战略合作协议,并就视频语料方向达成战略合作。
捷成股份 该公司是国内影视剧版权运营的领导者,目前拥有4803部新媒体电影版权。
图形语料:
视觉中国
集团拥有近万名签约摄影师和艺术家,并与国内外数百家图片机构、影视机构和版权机构广泛合作。
金融语料:
同花顺
公司自主研发的HithinkGPT模型,预培训金融语料达到万亿级,涵盖金融行业多方面数据,具有全面的实时金融数据和强大的语义理解。
消费语料:
汇纳科技
公司自成立以来,一直致力于线下消费行为数据分析,旨在“成为中国最大的线下消费数据提供商”。
值得买
基于通用模型,公司利用自己独特的数据资源和语料库,开发了值得购买的大型消费模型。
医学语料:
贝瑞基因
公司年产出的基因数据量已超过PB级,基于独特的数据库资源和云计算平台,建立了几十种科研服务细分产品类型。
卓创资讯
它是一家专注于大宗商品市场数据监控、交易价格评估、行业数据分析和行业研究的专业服务提供商。