OpenAI寻求合作伙伴以获取公共网络之外的数据
 
                    OpenAI目前正在寻求数据合作伙伴,打算与各组织合作生成用于训练人工智能模型的公共及私有数据集,旨在提高人工智能对特定领域或主题的整体理解能力。
该公司的官网博客上写道,为了让人工智能深入理解各个行业、文化和语言,它需要尽可能广泛的训练数据集。“现代人工智能技术通过理解其训练数据来学习我们世界的方方面面——人、我们的动机、互动和交流方式。”

据了解,OpenAI主要对反映人类社会的、目前在公共网络上不易获取的大规模数据集感兴趣。提交的数据类型可以是文本、图像、音频或视频格式。该公司表示,他们有能力处理几乎任何形式的数据,他们拥有世界一流的光学字符识别(OCR)技术,可以将PDF等文件数字化,以及自动语音识别(ASR)技术,可以将口头语言转录为文字。
OpenAI表示他们不寻求包含敏感或个人信息的数据集,也不寻求属于第三方的信息,并可以协助删除提交数据中的这些信息。
目前OpenAI公开了两种合作方式,一是可供任何人在AI模型训练中使用的开源数据集;二是用于训练专有AI模型的私有数据集(OpenAI表示将根据对方的要求对数据设置相应的敏感性和访问控制级别)。

该公司表示他们已经与许多组织合作,例如冰岛政府和Miðeind ehf。通过整合这部分数据集,提升了GPT-4对冰岛语的熟练程度。再如与非营利组织Free Law Project合作,将他们的法律相关文件收集纳入了人工智能训练中。
编辑:左右里
资讯来源:OpenAI官网
转载请注明出处和本文链接
NIST 网络安全标准
美国使用的一种框架,可帮助企业为防御网络犯罪做好准备。
﹀


球分享

球点赞

球在看

[广告]赞助链接:
                        关注数据与安全,洞悉企业级服务市场:https://www.ijiandao.com/
                        让资讯触达的更精准有趣:https://www.0xu.cn/
                    
 关注KnowSafe微信公众号
            关注KnowSafe微信公众号随时掌握互联网精彩
- 腾讯开源重磅项目:WeKnora让企业文档瞬间变身AI知识库!
- WaterCrawl开源爬虫神器碾压传统工具
- 微软Edge更新 收藏夹图标悄然改头换面:从黄色变透明
- PlayOK:在线和其他真人玩家对弈,摸鱼,我是专业的
- 科大讯飞回应薪酬回溯制度;OpenAI宣布开放API,开发人员可将ChatGPT集成到自己产品;Godot 4.0发布|极客头条
- 马斯克每周“硬核”工作 120 小时,网友:“只要醒着都在工作?”
- 大展宏“兔”!华为中国兔年定制红包封面来了
- 华为云发布代码检查服务;微软向其美国雇员提供“无限制”休假时间;付费版 ChatGPT|极客头条
- 什么样的CISO对企业来说是有用的?
- 诸子笔会 | 从工作规划看网络安全人的职业规划
- 没有特斯拉的 3·15 都曝了些什么?
- 圣诞鹿拍了拍你,邀你跳支会飞的舞

 
                 
             
             
            
 
        
 
        
