欢迎光临
我们一直在努力

计算机科学家正在为程序员开发负责任的人工智能模型

  

  相信人工智能技术的开放式科学合作,东北大学的一位教授与其他人一起为程序员创建了一个最先进的开放式生成模型,该模型可以获得许可,并适用于游戏和工业自动化等不同用途。

  东北大学胡里计算机科学学院计算机科学副教授阿琼·古哈(Arjun Guha)说,在过去几年里,生成式人工智能和大型语言模型席卷了世界。它们对编程产生了特别重大的影响。

  然而,计算机科学家、程序员和较小的市场参与者对这些模型的开发过程的了解非常有限,这阻碍了他们对技术进行更深入的理解。它还把它们排除在有意义地参与其进一步扩张之外。

  这就是为什么Guha和他的研究小组积极参与了由两家私营公司——hug Face和ServiceNow发起的BigCode项目。

  拥有大型开源机器学习社区的公司hugs Face和帮助企业优化技术解决方案的公司ServiceNow联手支持具有专业人工智能研究背景的个人负责任地开发和使用开放的大型语言模型进行编码。他们为这个项目投入了大量的人力和硬件资源。因此,StarCoder,一个最先进的,面向程序员的开放生成模型,现在可以被其他人授权和改编用于不同的用途。

  Guha说:“你可能花了大量的钱来建造这些东西,但却不知道它是否有用。”

  Guha说,少数几家拥有数十亿美元资产的公司拥有资源来建立这样的学习模型,并时不时地“放弃”它们来震惊世界,但他们完全不愿意与社区分享这项技术的能力。

  “如果你问制作它们的人,‘我能用它做什么?’我认为他们总是会不诚实地给你答案‘什么都可以’,这是一种误导。”

  Guha认为,学术研究在塑造生成式人工智能技术方面可以发挥作用。

  “一个学者可以进来,严格地评估这些东西,说这是它的优点和缺点。是的,用它来做这件事,但请不要用它来做其他事情,没有一些严肃的护栏,”古哈说。

  更紧迫的问题是,人们利用这项技术做出影响他人的决定,例如,关于贷款申请或职位空缺的决定。

  他说:“我们应该讨论一下,什么时候不适合使用这些模型,什么时候它们弊大于利。”

  Guha在2022年9月推出的BigCode上投入了大量精力,他说,他领导了一个工作组,专注于评估该项目创建的开放模型StarCoder和SantaCoder。

  构建法学硕士首先需要确定将被输入模型以训练它的数据。古哈说,当模型经过训练后,应该评估它实际上能做什么和不能做什么。

  BigCode项目创建的模型是在“拥抱脸”集群中训练的。Guha的团队在马萨诸塞州绿色高性能计算中心的东北发现集群对其中的大多数进行了评估,这是一个高性能并行计算系统,结合了尖端的计算技术和强大的存储解决方案。

  他们对19种不同的编程语言进行了广泛的评估,以了解模型的功能。

  Guha说:“当这个项目启动时,其中一个目标是让它在很多语言上工作,让几个社区感到高兴。”

  对这些模型进行了测试,以实现从自然语言描述生成代码、记录代码和预测类型注释等任务。

  其他研究人员进行了其他分析,例如偏差和毒性分析,该分析表明,由于编码模型没有接受过大量互联网数据的训练,因此它消耗的有毒内容较少,也不太可能产生有毒的输出。

  Guha说,由于BigCode项目的大规模协作性质,StarCoder模型经历了有史以来最广泛的评估。

  他说:“这是一个伟大的项目,汇集了许多处于职业生涯不同阶段的研究人员。”

  今年5月,BigCode项目的这一部分发表的论文有近70位共同作者。古哈说,一些博士生和本科生能够为这个模型做出贡献。

  现在任何人都可以要求下载和免费使用Starcoder或Santabase用于研究,商业或非商业目的,只要他们签署BigCode开放负责任的人工智能许可协议并遵守适用的限制,包括修改后的材料。

  例如,Guha正在与MathWorks(一家专门为工程师和科学家提供数学计算软件的公司)和Roblox(一家在线全球游戏平台)合作,探索如何使用StarCoder,将其引入内部并根据他们的需求进行定制。

  古哈说,许多研究人员也在使用这个模型。

  Guha说,BigCode项目对其模型使用的数据非常透明和明确。如果人们希望该项目停止使用他们的数据,他们可以提出请求。到目前为止,只有几十个人这样做了。

  BigCode正在为下一轮项目做准备,预计很快就会公布进一步的进展。引用本文:计算机科学家为程序员开发的负责任的人工智能模型(2023,September 12)检索自https://techxplore.com/news/2023-09-responsible-ai-programmers-advanced-scientist.html。本文受版权保护。除为私人学习或研究目的而进行的任何公平交易外,未经书面许可,不得转载任何部分。内容仅供参考之用。

 收藏 (0) 打赏

您可以选择一种方式赞助本站

支付宝扫一扫赞助

微信钱包扫描赞助

除特别注明外,本站所有文章均基于CC-BY-NC-SA 4.0原创,转载请注明出处。
文章名称:《计算机科学家正在为程序员开发负责任的人工智能模型》
文章链接:https://www.xpn.cc/37387/fy.html
分享到: 更多 (0)

热门推荐

登录

忘记密码 ?