网页历史给AI未来的启示近期生成式AI的进步令人兴奋它必将对未来产生重大而未知的影响。我们未来还需要开发者吗他们会被AI取代吗大科技公司会垄断这项技术吗我们会完全依赖API提供商牺牲开源精神和数据隐私吗作者认为我们可以从另一项突破性技术——互联网中学到很多。从互联网历史中学习作者分享了自己从2006-2009年学习CSS和网页开发到如今投身于NLP自然语言处理和AI领域的经历。这展现了技术演进的个人视角。Python在AI领域的成功恰恰因为它是一门通用语言。2023年Python开发者调查显示Python在数据分析、Web开发、机器学习等多个领域都有广泛应用其通用性是它在AI领域获胜的关键。大科技公司是在“重新发明轮子和道路”回顾互联网历史某中心原谷歌凭借搜索、Chrome/Chromium浏览器驱动着某中心原微软Edge、Opera等、Gemini模型以及广告业务构建了庞大的生态。他们也曾推动加速移动页面AMP等项目。这引发我们思考大科技公司会垄断AI吗我们关心的问题我们还需要开发者吗大科技公司会垄断AI吗开源软件的未来如何AI开发者会被AI取代吗我们会依赖API提供商吗如何保证数据隐私核心洞见不要混淆“抬高地板”和“抬高天花板”“地板”指基础、易用的技术。例如本地商店无需开发者就能建网站10%客户待办事项App用API增加翻译功能5%国际用户增长。这些是高采纳率的技术让更多人能完成基本任务。“天花板”指高价值、复杂的应用。例如流媒体服务让网页播放器快1毫秒3%使用时长酒店预订平台改进推荐系统0.5%点击率100万美元收入。这些是高价值的应用需要开发者进行深度优化。未来AI的技术栈将包括网站构建器、框架、浏览器、Web标准、AI功能而开发者则专注于构建框架、环境和核心技术以触及更高的天花板。高价值用例值得投入开发以某机构原SP Global的案例研究为例场景在高安全环境下从实时大宗商品交易洞察中提取结构化属性。方法在标注过程中使用大语言模型LLM通过人机协同将数据开发速度提升了10倍。成果最终部署了8个以上市场管道模型大小仅6MBF-Score达到99%处理速度超过16,000词/秒。人机协同蒸馏流程LLM提示利用LLM进行初步数据标注。Prodigy工具在“人机协同”流程中进行持续评估。组件迁移学习将LLM的知识蒸馏到更小的组件中。蒸馏模型生成更小、更快、更私密的模型。部署将优化后的模型投入生产。这个开发过程让开发者重新夺回控制权。开发工作流的演进静态页面 → 动态页面 → 静态页面构建时编译静态数据自定义模型 → 预训练模型 →蒸馏模型将模型蒸馏成更小、更快、更私密的组件AI产品不止是模型AI产品的成功不仅取决于技术更在于产品层面的差异化。机器 facing 模型如GPT-4。人类 facing 系统如ChatGPT。关键差异化因素UI/UX、营销、定制化、速度、准确性、延迟、成本。可互换组件基于研究成果可以量化影响并轻松替换组件如LLM。关于数据用户数据是产品的优势而非机器 facing 任务的基础。获取通用知识并不需要特定的数据。互操作性才是垄断的对立面。结论与启示对开发者不要混淆“抬高地板”与“抬高天花板”。高价值用例值得投入精力去开发。对模型通过在开发时编译夺回控制权构建更小、更快、更私密的模型。对开源互操作性是垄断的对立面。LLM可以成为产品或流程中可替换的一部分。对监管监管应聚焦于产品和行为而非技术组件。FINISHED更多精彩内容 请关注我的个人公众号 公众号办公AI智能小助手或者 我的个人博客 https://blog.qife122.com/对网络安全、黑客技术感兴趣的朋友可以关注我的安全公众号网络安全技术点滴分享