「雷峰网」2024 年年初ღ★,拥有编程全栈技能的 Devin 惊艳全球ღ★,让外界看到了 AI 改变一个行业——替代程序员的可能性ღ★。
Devin 发布数周后ღ★,其背后的公司 Cognition 也随即获得 1.75 亿美元融资ღ★,估值从 3.5 亿美元一跃升至 20 亿美元ღ★。紧接着ღ★,4 月ღ★,一家 AI 编码辅助创业公司 Augment 宣布完成 2.52 亿美元的融资ღ★,投后估值接近独角兽ღ★,代码生成赛道的多米诺骨牌效应开始出现……
到上半年ღ★,硅谷代码生成类的公司估值起步价已经高达 2 亿美金ღ★,头部公司甚至 20 亿美金ღ★。而据一位行业人士分析ღ★,代码生成的概念之所以受到追捧ღ★,其中一个重要原因是“人类的数据不够用了”ღ★。
AGI 时代的一个重要组成是人类必须依靠机器生成的数据ღ★,而代码生成的数据被部分从业者认为是“人类通往 AGI 过程中最有逻辑性与严谨的数据”ღ★。
与此同时ღ★,网络上为大模型代码生成提效欢呼的声音越来越多ღ★。例如ღ★,一位中国开发者就提出ღ★,Claude 3.5 Sonnet 只要 500+ 行的 html 就能实现一个不错的功能ღ★;还有开发者称ღ★,其借助 GPT-4o 辅助代码写作ღ★,以前开发小程序需要一个月ღ★,现在只需要七天……
事实上ღ★,程序员对于“AI 代码生成”的想象早有年头ღ★。在这波生成式 AI 浪潮之前ღ★,市场上就已出现一系列的 AI 编程工具ღ★,例如 Tabnineღ★、Kite 等雷电将军乳液voiuxღ★,但受限于它们的技术路径ღ★,过去的产品对于上下文逻辑的理解和代码生成的质量不尽人意ღ★。
清流资本合伙人刘博告诉 AI 科技评论ღ★,AI 编码工具的其中一个效果评估指标是代码文件中由模型生成的代码占比ღ★,上一代工具只能做到 10-20%ღ★,而新一代的 AI 编程工具最高可以做到 40-50%——这是质的飞跃ღ★,同时新一代工具对编程上下文的理解也显著更好ღ★。
迄今大模型狂飙一年半ღ★,在所有基于大模型的新 AI 工具中ღ★,coding 场景的 PMF 和付费意愿最先被验证ღ★,GitHub Copilot 仅用 14 个月便达到了 1 亿美元 ARRღ★,是历史上增长最快的 SaaS 产品——这与其他场景里昙花一现的 AI 产品形成鲜明对比ღ★。
国内创业公司也开始增多ღ★:一站式 DevOps 研发管理平台 Coding 创始人张海龙创立了 AI Agent 公司 Babelღ★,企业智能化软件开发解决方案提供商 aiXcoder 也因此受到资本关注ღ★、并在2023年迅速完成了 A+ 轮融资ღ★。
多方势力角逐ღ★,创业公司在混乱中争取生机ღ★,而创业公司ღ★、通用大模型公司ღ★、科技大厂各方仍然面临 AI 领域发展的通用问题ღ★:To C 还是To Bღ★,技术路径选择通用大模型还是垂直模型ღ★,要不要自研模型ღ★,以及如何在 GitHub Copilot 的笼罩下突围ღ★。
值得注意的是ღ★,受限于底层技术大模型的能力ღ★,目前各种 AI 编程产品仍然集中于 coding 阶段ღ★,在代码补全和代码生成两个场景 PKღ★,所以本质上ღ★,现在的 AI 编程产品依然是 AI codingღ★。
软件开发的智能化最开始就是从代码生成和代码补全开始的ღ★。因为技术容易实现ღ★,不会颠覆程序员的开发模型ღ★,代码补全是整个行业做的比较成熟的功能ღ★,不管是大厂还是初创公司ღ★,产品都能用起来ღ★,且正确率较高ღ★。
在一个已有的项目中根据上下文去增加新功能叫代码补全ღ★,即开发者用自然语言表达一个需求ღ★,用代码生成ღ★。代码生成现在正处于从文件级代码到项目级代码的突破ღ★。
代码生成还处于初级阶段凯发K8国际娱乐官网ღ★,简单的函数能生成得比较好ღ★,但并不是完全靠大模型ღ★,需要外挂一些知识库配合ღ★,不能达到100%准确ღ★,若再想扩展到一个文件级的代码生成ღ★,难度则会增高ღ★,往仓级别的难度会更高ღ★,而 Devin 展示的就是往仓级别去实现ღ★。
一位研究代码智能的专家告诉 AI 科技评论ღ★,代码补全现在是兵家必争之地ღ★,是已经真正落地ღ★、也是程序员使用最多的场景ღ★。相对来说ღ★,代码生成功能的使用频率相对少一些ღ★,目前要真正融入到日常的开发成为高频选项还有一些距离ღ★,原因是代码生成需要改变程序员的开发模式ღ★、开发习惯ღ★。代码生成目前依然是通过跟一个对话机器人对话ღ★,用自然语言表达需求来让大模型生成一段代码ღ★,在这个过程中不断交互ღ★、表达需求ღ★,需求表达地越清晰ღ★、生成的代码越准确ღ★。这过程中涉及到需求拆解ღ★。将一个大的需求拆解成一个个的小任务ღ★,再去生成ღ★,需求拆解对于当前大模型来说还有难度ღ★。同时ღ★,由于编程思维跟自然语言表达是两回事ღ★,对于开发者来说ღ★,一个人代码写的好ღ★,并不意味着用自然语言表达业务逻辑好ღ★,它需要具备两方面的能力ღ★。一是要熟悉业务ღ★,二是要扎实的计算机理论知识ღ★,包括算法ღ★,操作系统ღ★,软件工程ღ★,计算机安全等ღ★,这其实对开发者的个人素养提出了很高的要求ღ★。
除了代码补全和代码生成两个高频场景ღ★,其他产品寻求差异化的出口是提供代码注释ღ★、代码解读ღ★、代码 bug 修复ღ★、代码优化ღ★、漏洞检测等能力ღ★。
例如国内智谱 CodeGeeX 便开发了独有的功能ღ★,例如去年年底推出的工具箱ღ★,就是基于模型具备Code Interpreter代码解释器能力ღ★,可以批量处理多种格式的文件ღ★、批量实现数据可视化ღ★、绘制数学函数图等ღ★。
CodeGeeX 负责人郑勤锴认为ღ★,在这些事情上为开发者节省了时间雷电将军乳液voiuxღ★,开发者就能将工作更多放在顶层设计上——怎么把代码的架构设计地更好ღ★、功能考虑地更完善ღ★,从而提高软件的质量ღ★。
智谱在2022年就完成了CodeGeeX代码大模型的训练ღ★,并同时推出了 CodeGeeX插件产品ღ★。
跟GitHub Copilot 一样ღ★,CodeGeeX定位是智能辅助编程ღ★,但辅助也分为不同层级ღ★,目前已经从单个文件辅助拓展到了项目级辅助编程ღ★,因为实际开发场景中不可能只有单文件ღ★,大多都是多文件ღ★。
CodeGeeX负责人郑勤锴称ღ★,往项目级拓展的挑战在于项目生成的成功率ღ★,因为代码项目往往不只是一小段代码或者一个文件的代码组成ღ★,而是同时需要完成项目中跨文件的代码理解和生成补全ღ★。让模型能充分理解更长的信息ღ★,并提取到关键部分ღ★,这对模型的要求很高ღ★。
对于参数量10B以下的代码大模型ღ★,从海量的代码中准确提取信息是一个关键性的挑战ღ★。CodeGeeX4支持128K上下文ღ★,能够处理和利用更长代码文件ღ★、包括项目代码中的信息ღ★,是模型更深入理解复杂和细节丰富的代码的关键点ღ★。
To B 企业用户月费 39 美元ღ★,企业用户可以将代码部署到云端ღ★,而不必在本地反复克隆ღ★;企业用户可以内建知识库ღ★,形成个性化的Copilot Chat(在原有Copilot的基础之上ღ★,开发者可以直接用自然语言和Copilot对话来解决遇到的问题)ღ★,甚至是对底层模型进行微调ღ★。
除了占据时间上的先发优势ღ★,GitHub Copilot 拥有两大先天优势ღ★,一是背靠拥有上亿开发者的代码托管平台 GitHubღ★,二是底层接入的是 OpenAI 最强的模型ღ★。
站在今天来看ღ★,微软对开发者市场的战略一直很清晰ღ★:2015 年推出跨平台代码编辑器 VScodeღ★,从用户侧统一IDEღ★;2018 年收购 GitHubღ★,拥有大量代码数据(包括商用的未公开的数据)ღ★;2019 年ღ★,微软向 OpenAI 投资了 10 亿美金ღ★,并获得了 OpenAI 技术的商业化授权ღ★。
于是凯发K8国际娱乐官网ღ★,在 2020 年 OpenAI 推出了 GPT-3 后ღ★,拿着最多的代码数据去训练模型ღ★,隔年 AI 编程工具 GitHub Copilot被推出ღ★,成为全球最早一款大模型 AI 编程工具ღ★,抢占了先发优势ღ★。
首先ღ★,AI 编程产品面向的中大型企业 B 端市场大概是几十亿人民币的规模ღ★,用户付费意愿非常明确ღ★,这一市场规模和客单价在软件服务市场上已经比较客观ღ★。
对于国内 B 端用户而言ღ★,他们有两个需求是 GitHub Copilot 无法满足的ღ★:1)模型本地部署ღ★,如果云端调用 GitHub Copilot 会有代码泄露的风险同时本地部署后可以根据客户的私有代码进一步训练ღ★,显著提升代码生成的效果ღ★;2)大客户需要选择国内的产品作为供应商ღ★,避免数据外流ღ★。
照着以上标准来找标的ღ★,清流资本在去年 9 月参与了国内面向企业的智能化软件开发解决方案提供商 aiXcoder A+ 轮投资ღ★。跟 GitHub copilot 不同ღ★,aiXcoder 聚焦 To Bღ★,为企业提供基于代码大模型的智能化软件开发解决方案ღ★,包含私有化部署ღ★、企业领域知识与大模型融合ღ★、定制化开发等服务ღ★。清流资本合伙人刘博告诉 AI 科技评论ღ★,B 端市场的打法是当公司在一个行业里已经渗透了足够多的客户后ღ★,就能成为 AI Coding工具实质上的行业标准ღ★,成为行业里其他企业采购 AI Coding 工具时必须邀请参与竞标的供应商ღ★。因此从国内的商业化角度出发凯发K8国际娱乐官网ღ★,先发优势和聚焦很重要ღ★。aiXcoder孵化自北京大学软件工程研究所ღ★,在2013年就开始研究深度学习跟代码结合ღ★,早在 2022 年 6 月便发布了中国首个百亿级参数的代码大模型 aiXcoder-13Bღ★,能够支持方法级(函数级)的代码补全ღ★。aiXcoder COO 李力行认为ღ★,代码大模型落地时ღ★,如何跟企业的领域知识或者私域知识相结合非常关键ღ★,从而保证生成的代码更准确ღ★,因为代码生成要用到很多上下文信息ღ★,以及一些外部的领域知识ღ★,领域知识是指企业的业务逻辑ღ★、业务知识等等ღ★。一位资深从业者认为ღ★,高质量的数据才是模型能力的区隔ღ★。公开的数据可能有一天终会达到瓶颈ღ★,但世界上还有大量的私有数据可能永远不会被公开ღ★,它们存在于各个 B 端企业内部ღ★,与企业业务逻辑强耦合ღ★。aiXcoder 在为客户做本地部署的时候会基于这些私有化数据进行再训练ღ★,给每个企业打造专属的代码大模型ღ★。
GitHub Copilot 占据了 C 端优势地位ღ★,国内玩家不约而同选择了 C 端免费策略ღ★,如智谱 CodeGeeXღ★、百度Comateღ★、腾讯云 AI 代码助手都推出了面向个人开发者的免费工具ღ★,这几家厂商跟 aiXcoder 一样ღ★、将商业化看向 B 端ღ★。
它们共同的思路是拿代码数据在各自的基座大模型上进行预训练或者微调ღ★,相同的代码数据来自GitHub和其他可公开访问的源代码ღ★,百度ღ★、阿里雷电将军乳液voiuxღ★、腾讯这些大厂还有一部分内部代码的积累ღ★。
收集数据的方式ღ★、选取数据的类型ღ★、训练的方法……整个训练过程多个环节的差异导致各个代码模型效果各异ღ★。
例如智谱 CodeGeeX 推出一体机的模式ღ★,开箱即用ღ★,提供完善的软硬件和使用方式ღ★,特点是可以结合企业内部的代码仓库ღ★、知识库来加强代码能力ღ★,优势是代码是私有化安全的ღ★。
企业更关注怎么跟企业内部的代码凯发K8国际娱乐官网ღ★、数据文档做结合ღ★,在模型训练阶段对这些代码并不了解ღ★,包括企业内部自己定义的 API 接口等等ღ★。
为了让模型更懂企业的代码ღ★,CodeGeeX 提供了几个方向ღ★:定制化的微调方案ღ★,在企业内部去用它们自己的代码去对模型进行强化ღ★,还包括 RAG 检索增强方案ღ★,即把企业代码和文档作为知识库来辅助预测ღ★。
有投资人并不看好创业公司做代码大模型凯发K8国际娱乐官网ღ★,他们认为 AI Coding 这块未来依然是通用大模型公司的事情ღ★,大模型公司更擅长做这件事ღ★,创业公司很难产生差异化ღ★,而且竞争对手太多了ღ★。
而且ღ★,软件 To B 一直面临的问题是国内 B 端客户用不起ღ★,这是国内 SaaS 一直没做起来的原因之一ღ★。
的确ღ★,根据开发者的反馈ღ★,如 GPT-4oღ★、Claude 3.5 Sonnet 这样的通用大模型现在也能保持不错的代码效果ღ★。
一位从业者认为ღ★,未来可能会有一个在所有模态上都很强的六边形战士模型ღ★,但真正从B端商业化落地来看ღ★,不太有太多公司有能力本地部署这样一个参数量巨大的六边形战士模型ღ★,市场仍然需要一个代码垂直模型ღ★。
首先ღ★,大厂需要在所有能做的事情里去选择以及决定对应的资源调配ღ★,对于大厂而言ღ★,有太多方向可以得到比单个 B 端 coding 场景更多的资源ღ★,比如通用大模型ღ★、AGI 等ღ★,而创业公司 100% 聚焦在一件事上ღ★;
其次ღ★,在垂直场景里ღ★,大厂的认知不一定比创业公司更深ღ★。B 端 AI coding是一个非常垂直且专业的场景ღ★,在大模型的基础上仍然需要大量进阶的代码 knowhow 和对客户需求的深度洞察ღ★。
aiXcoder COO李力行认为ღ★,首先需要通过全流程的数据治理和个性化训练ღ★,使大模型能够深刻理解并掌握企业领域知识ღ★,落地企业专属代码大模型ღ★;随后ღ★,利用多 agent 等方式结合传统软件开发工具和方法ღ★,高效地解决企业复杂的软件开发任务ღ★。
软件开发是一个复杂的系统工程ღ★,coding只占其中很少的部分ღ★,还涉及到需求理解ღ★、debuggingღ★、优化ღ★、部署等多个环节ღ★。而以 GitHub Copilot 为首的 AI 编程辅助产品现在只能写点“函数砖头”ღ★,砌墙的事还得程序员亲自来ღ★。
在 3 月初创公司 Cognition 的 demo 演示中ღ★,Devin 化身为一个拥有“全栈技能”的AI程序员ღ★,一个能够独立完成任务的自助系统ღ★,在快速原型设计ღ★、修复bug和复杂数据的可视化上表现优秀ღ★。
从交互上ღ★,Devin 带来了一种新的AI软件开发形态ღ★,包括命令行ღ★、浏览器等组件雷电将军乳液voiuxღ★,是第一个脱离 IDE 的软件开发形态ღ★。从实际任务上ღ★,Devin 愿景是完成整个软件开发的需求任务ღ★,这种能完成更复杂开发任务的 Agent 已经成为业内确定的产品趋势ღ★。
一位 AI Agent 创业者赵聪认为ღ★,issue level 的 coding 都需要用 Agent 来实现ღ★,解决的是更复杂的问题ღ★,自动解 issueღ★。issue 等同于文件级的代码ღ★,而现在的代码生成ღ★、补全都是在单文件上ღ★,解 issue 往往是针对整个项目ღ★,拥有多个文件ღ★。
aiXcoder COO 李力行看好 Agent 在软件开发领域的应用ღ★,他认为多 Agent 协作也让全流程代码生成等更加复杂的开发任务成为可能ღ★。在2024年ღ★, aiXcoder 推出基于Agent技术的智能化软件开发系统2.0ღ★,通过大模型+软件开发工具调用解决企业项目级代码生成问题ღ★,确保复杂开发场景下代码生成的高效性ღ★、准确性和可靠性ღ★。
Devin 想要去解决一个问题ღ★,或者说修改一个仓密度的代码ღ★,大家都在朝着 Devin 的方向做探索ღ★,但大模型能力现在几乎还达不到ღ★。目前 Agent 还处于探索ღ★、实验阶段ღ★。
距离 Devin 发布已经过去五个月ღ★,依然没有任何更进一步的消息ღ★。其 CEO Scott 也透露ღ★,他们尚无明确的公开预览(public preview)时间表ღ★,目前仍在内测阶段ღ★,即无确定的产品形态ღ★。
CodeGeeX 负责人郑勤锴则认为ღ★,Agent 只是实现某个功能的路径ღ★,现在的 Agent 很多只是简单的工具调用ღ★。重要的还是看最终实现的功能ღ★,能达到多高的可用性ღ★。
赵聪认为未来的创业机会在 AI Agentღ★,因为 AI 编程赛道上 Copilot 微软已经做了ღ★,很难再与之竞争ღ★,所以只能往前走ღ★,即直接替代人ღ★。开发者平时很多工作都类似于拿着螺丝刀拧螺丝ღ★,Copilot 就是把螺丝刀换成了电钻ღ★,而 AI 程序员则是给开发者配个小弟ღ★,所以 Copilot 依然是个好工具ღ★,但 AI 程序员就是生产力ღ★,这是完全不同的两件事ღ★。
但做 AI 程序员不是科学问题ღ★,而是个工程问题ღ★。这里涉及路径选择的问题ღ★,在做 AI 程序员时有公司是自己做模型凯发K8国际娱乐官网ღ★,赵聪认为这是错误的路径ღ★,他不相信所谓的小模型/垂直模型ღ★,觉得模型就只有大模型ღ★,因为只有大模型能带来智力ღ★。
未来面临的挑战是ღ★,所有人都要往 project level coding 走ღ★,要依赖底层模型的进化ღ★,但模型太贵雷电将军乳液voiuxღ★。赵聪认为GPT-4 至少得再降价 10 倍ღ★,才具有真正的可能性ღ★。
在软件工程中ღ★,AI 难以解决的两大问题是ღ★:1)复杂项目的业务上下文理解ღ★。2)每家公司独特的工程架构ღ★、逻辑和实践ღ★。在解决这两个问题之前ღ★,AI Agent 还无法完全替代人类程序员ღ★。
但多位从业者一致认为ღ★,随着 AI 不断进化ღ★,未来高级程序员不会被替代ღ★,拧螺丝的初级程序员被替代已经能看到ღ★,未来程序员的培养路径也跟现在不一样ღ★,就像高科技种地ღ★,不需要真的从种地开始学ღ★,而是先从学习使用工具开始ღ★。
未来 C 端应该更好地服务普通人ღ★,而不仅仅是开发者ღ★,如果普通人也能通过 AI 实现编程ღ★,那么 C 端有可能完成一次爆发ღ★,而这需要更强的模型能力ღ★,端到端仍然需要 Agent 来实现ღ★。
媒体链接:http://xqqelc.com/kaifak8yichujifa/224.html
k8凯发(中国)天生赢家·一触即发
http://www.xqqelc.com