公司新闻

COMPANY NEWS

首页 - 公司新闻

首个AI软件工程师上线已通过公司口试抢次序员饭碗
发布时间:2024-03-14 23:17:36

  首个AI软件工程师上线已通过公司口试抢次序员饭碗正在 SWE-Bench 根本测试中,无需人类协助,Devin 就能够办理 13.86% 的题目。而目前的 SOTA 模子,正在没有人类协助的环境下,只可杀青 1.96% 的职分。

  Devin 现正在还未对外怒放,但仍然有开辟职员和产物职员用上了。测试过的网友默示,以前向来用人工智能辅助编码,但向来打击。直到昨天,他给 Devin 了一个纯粹的 HTML 页面,让它提取采选器,这个 GPT-4-turbo 、Claude、Groq 、LLama2 都没杀青的职分,Devin 只用了大约 10 秒就搞定了。

  要清爽,固然现正在市情上的一系列大模子都有编程才力,但公共半都采用了单行代码补全或者单个函数天生的格式。思天生完美的措施,还须要策画 prompt 渐渐「」。

  Devin 装备了席卷 shell、代码编辑器和浏览器正在内的常睹开辟用具,这些都正在一个沙盒化的计划处境中 —— 这些都是人类软件工程师杀青使命所需的统统。

  Devin 可以是通向他日,人类正在更高层级实行空洞监视的流程中一环,正在这个流程中仍有许众题目须要办理。比如,人工智能部门以及用户界面 / 用户体验部门都有许众使命要做。人类怎么供给监视他们怎么指引人工智能走向区别的旅途?他们怎么调试犯错的地方?代码编辑器的策画有可以须要大幅更改。

  正在杀青项宗旨流程中,它应用了浏览器为 API 留档,以便它能够阅读并进修怎么插入这些 API:

  你给它一篇新博客,讲的是怎么运转 ControlNet on Modal,天生带文字的图像:

  看到 Devin 的 Demo 后,刚从 OpenAI 辞职的 AI 大牛 Andrej Karpathy 揭橥了少少独到的意睹。正在他看来,主动化软件工程的发扬将似乎于主动化驾驶,是一部分工智能做的越来越众,而人类的使命越来越少,但仍供给监视的流程。

  莫非继 Sora 让「实际全邦」不存正在了之后,Devin 也要让「软件工程」不存正在了吗?

  比如请它正在几个区别的 API 上对 Llama 的浮现实行根本测试,它最先拟定了一个渐渐办理题目的策划:

  自助进修,从完整目生的学问进修应用不熟识的身手,

  Scott Wu - 首席推行官 (CEO):Scott 是团队的头领者,和他的兄弟 Neal Wu 一块,自青少年时刻就滥觞列入并时常获胜于邦际编程竞争,曾延续三年揽获 IOI 金牌,这些竞争擢升了他们的编程才力。Scott 的配景和对算法题目的深切意会为 Cognition AI 的开辟供给了奇特的视角。

  除了这三位中枢成员,又有一位 Neal Wu,他是 Scott Wu 的兄弟,他也正在 Cognition AI 使命。Wu 兄弟因其编程本领正在环球限度内享有盛誉,他们自青少年时刻起就正在邦际编码竞争中比赛并常获告捷,这些竞争体会助助他们正在编程和办理题目方面具有奇特的技巧。

  前段时候,英伟达 CEO 黄院士发出惊人舆论:「都别学编程了,自此交给 AI 就行了,自此人人都是软件工程师。」当时又有许众人破坏,说「AI 永久不会庖代措施员。首部分工智能软件工程师 Devin 一宣布,措施员的饭碗可以真要被 AI 端走了。

  官方发的推特说,Devin 不单通过了一家业内领先的人工智能公司的口试,正在自正在职业平台 Upwork 上也能凯旋接单,杀青单苛重求的使命。也便是说,Devin 不单是横扫根本测试的「做题家」,正在就业市集里也有人工它的使命才力买账。

  Devin 能主动杀青这样繁复的计议,得益于其背后的 Cognition AI 正在永远推理和计议方面的起色,这使它也许正在每一步纪念闭连的上下文,随时候进修,并修复差池。

  Devin 具有主动的互助的才力,它能及时通知进度,接收反应,并按照须要调动,还能适当成熟的代码库,修正长辈留下的 bug:

  仅从评测结果看,Devin 办理可靠全邦软件题目的才力要远好于眼前的 GPT-4 和 Claude 等模子。

  总体来看,与其他具有编程才力的大模子,Devin 不单辅助编程或供给代码片断,它也许独立援助一扫数项目,而不单仅是辅助或供给代码片断的创议。比拟于「副驾驶」的脚色,Devin 更靠拢于一个独立使命家。而 Cognition AI 声称 Devin 告终了正在 AI 界限被称为「意会」的打破,这意味着它也许不单是正在预测下一个单词或代码行应当输出什么,而是更像正在思索怎么办理题目的总体技巧。

  扫数 Cognition AI 团队由 10 人构成,席卷得到过 10 枚邦际竞争金牌的运动编码者。

  Devin 乃至也许操练和微调己方的 AI 模子,看来 AI 的性命将近正在方今杀青闭环了。仅通过一个 GitHub 堆栈的链接,Devin 就微调了一个大型说话模子:

  而 Devin 的身手旅途,CognitionAI 并还未公然,只是简腹地提到,Cognition AI 的团队发觉了将大型说话模子(LLM)如 OpenAI 的 GPT-4 与加强进修身手纠合的奇特技巧。这种技巧可以是他们身手打破的要害点。

  正在 Upwork 接的单里,Devin 被恳求编写并调试运转计划机视觉模子的代码。它采样完毕果数据,结尾透露了一份通知:

  按照自然说话提示主动写代码、天生完美的措施并上线只是 Devin 的基操,它能够主动计议并推行须要数千个计划的繁复职分。

  Walden Yan - 首席产物官 (CPO):Walden 直到近来还正在哈佛大学上学,他乞求将他正在学校的状况留作恍惚,概略率是思「辍学创业」。

  本文为倾盆号作家或机构正在倾盆讯息上传并宣布,仅代外该作家或机构意见,不代外倾盆讯息的意见或态度公司新闻,倾盆讯息仅供给音讯宣布平台。申请倾盆号请用电脑拜候。

  这支团队的成员正在编程竞赛中得到的成效和对题目办理的奇特技巧。个中三位创始人音讯如下:

  碰到不测的差池时,Devin 决意先「print」出来,再按照日记中的差池决意怎么修复 bug:


 
  上一篇:测试测试测试测试测试测试测试测试测试测试测试测试测试测试测试测试测试测试测试测试测试测试测试测试测试测试测试测试测试测试测试测试测试测试测试测试
  下一篇:【Space X“星舰”重型火箭第三次试飞發射升空】據美邦有線電視音訊網等媒體報道本地時辰14日美邦太空尋求本事公司
0755-26558528
hzj@tsingyandz.com

微信

官方小助手