文献阅读读读:LLMatic|GECCO|2024
文章目录论文信息论文主要贡献论文创新点方法4.14.2实验分析消融实验图表展示消融实验整体结论复盘论文信息论文题目 LLMatic: Neural Architecture Search via Large Language Models and Quality Diversity Optimization论文作者 Muhammad U. Nasir Sam Earle Christopher W. Cleghorn Steven James Julian Togelius发表会议 GECCO 2024代码链接 https://github.com/umair-nasir14/LLMatic论文主要贡献本论文主要提出了一种将大语言模型的代码生成功能与QD质量多样性检测结合引入有意义的变异并生成多样的鲁棒性解的、全新的基于大语言模型并依托于双质量多样性存档的神经架构搜索算法——LLMatic。本算法并在CIFAR-10 与 NAS‑bench‑201 基准测试集上进行了实验验证结果证明即便不具备该基准领域的先验知识也未接触过该基准上任何已有的顶尖模型LLMatic 仅需评估 2000 个候选网络就能生成性能极具竞争力的网络。论文创新点将大语言模型的编码功能与QD质量多样性检测进行结合不局限于生成单一的最优解而是一系列的高架构、多样性、高性能的新型架构。用大语言模型取代传统意义上MAP-Elites算法中的进化算子利用大语言模型实现代码有意义的进化生成。提出了全新的双档案协同质量多样性方法。设立两个档案互补存在组合完成特定任务。改变了提示词档案库中的特征维度。方法4.1从一个非常基础的神经网络开始训练实验证明刚开始训练的模型越简单最后得到的效果越好。设立了两个独立的档案分别存储内容两者的组成内容互补可组合完成特定任务。第一个档案库是网络档案库。其中储存着所有的神经网络架构。将网络的宽深比和每秒的浮点数作为行为描述符。网络的宽深比是网络的宽度所有曾输出特征维度的最大值与深度网络总层数的比值用浮点数而非参数值是因为浮点数与网络实际训练的关联度更高。网络档案库的更新指标是库中网络的适应度函数其定义为训练后的准确率。按照行为描述符分成的小生态位若是空的则将新生成的神经网络架构填入若存有一个架构则比较更新指标差者直接淘汰。最后每个生态位只保留性能最好的解。第二个档案库是提示词档案库其中以提示词内容文本特征通常编码为数值和温度作为行为描述符。温度越高发散能力越强得到的架构多样性越高反之则确定性越强。后续过程中提示词和温度的选择取决于好奇心评分即生成的网络是否被加入网络档案库。提示词档案库的更新指标取决于个体的集体适应度分数。在每一轮变异后计算出提示词个体的适应度加入集体适应度分数。而集体适应度分数决定着每个个体的整体适应度会赋值给个体一个分数。4.2第一代由一个卷积加一个全连接层的简单神经网络和随机选择的提示词开始生成初始批次的网络该批次网络会被评估是否能加入网络档案库作为MAP-Elites的随机初始化。根据网络的适应度对温度进行变异适应度越高温度提高反之降低。若希望大语言模型自我探索温度升高大语言模型对已有的模型进行利用则温度降低。当任一档案库到指定容量后引入神经网络训练和进化算子。接下来每一代中系统都会以一定概率执行交叉操作0.3还是变异操作0.7以产生N个新后代。交叉操作随机N个神经网络在档案库中找到最相近的网络架构。按提示词操作。在交叉操作中提示词档案库不变。变异操作选择好奇心评分最高的提示词和一个随机网络个体进行变异。当促进探索时也会随机选择提示词这两种情况下网络训练一定轮次尝试添加网络档案库中持续预设的代数。最后得到一系列多样性、高性能的神经网络架构。实验分析消融实验图表展示上图为柱状对比图横轴为各组消融实验纵轴为CIFAR-10测试准确率直观展示完整模型vs各消融组的性能差距。MethodCIFAR-10CIFAR-100ImageNet16-120DARTS54.30±0.0015.61±0.0016.32±0.00Random Search93.70±0.3671.04±1.0744.57±1.25GENIUS93.79±0.0970.91±0.7244.96±1.02Λ -DARTS94.36±0.0073.51±0.0046.34±0.00LLMatic94.26±0.1371.62±1.7345.87±0.96Optimal94.4774.1747.33上表为对应数值表同步标注准确率、档案填充率、评估效率三项核心指标。消融实验整体结论复盘全组件必要性验证任意剔除一个核心组件都会导致模型的测试准确率、网络多样性或搜索效率出现明显下滑证明 LLMatic 的双档案库、进化算子、温度调控、好奇心筛选、MAP-Elites 机制均为核心必要模块无冗余设计。核心组件优先级提示词档案库、MAP-Elites 择优归档、好奇心分数对算法效果影响最大其次是交叉算子与温度自适应纯LLM直接搜索完全无法胜任NAS任务。实验核心价值通过消融实验彻底证明LLM代码生成能力QD质量多样性优化的结合思路成立且程序化的进化迭代方式远优于直接用LLM提示词做NAS为后续LLM驱动的神经架构搜索提供了可靠的设计依据。

相关新闻

Google新一代AI图像生成模型Nano Banana 2正式发布,国内科技巨头纷纷布局

Google新一代AI图像生成模型Nano Banana 2正式发布,国内科技巨头纷纷布局

引言近日,Google正式发布了新一代AI图像生成模型Nano Banana 2(Gemini 3.1 Flash Image),这款模型以其出色的图像生成能力和高效的性能引起了业界的广泛关注。与此同时,国内科技巨头如阿里巴巴、网易等也在积极布局AI图…

2026/7/5 2:27:28 阅读更多 →
计算机毕业设计java基于Java开发的药店药品管理系统 基于B/S架构的药店药品进销存与订单管理系统设计与实现 面向药店的药品信息、库存与在线问诊一体化平台开发

计算机毕业设计java基于Java开发的药店药品管理系统 基于B/S架构的药店药品进销存与订单管理系统设计与实现 面向药店的药品信息、库存与在线问诊一体化平台开发

计算机毕业设计java基于Java开发的药店药品管理系统490pr9(配套有源码 程序 mysql数据库 论文) 本套源码可以在文本联xi,先看具体系统功能演示视频领取,可分享源码参考。随着医药卫生事业的快速发展和人们对健康需求的日益增长,药…

2026/5/17 9:17:16 阅读更多 →
代码随想录算法训练营第2天 | 209.长度最小的子数组、59.螺旋矩阵II、区间和、开发商购买土地

代码随想录算法训练营第2天 | 209.长度最小的子数组、59.螺旋矩阵II、区间和、开发商购买土地

代码随想录算法训练营第2天 | 209.长度最小的子数组、59.螺旋矩阵II、区间和、开发商购买土地209.长度最小的子数组题目描述解题思路解题过程59.螺旋矩阵II题目描述解题思路解题过程区间和(前缀和)题目描述解题思路解题过程开发商购买土地题目描述解题思…

2026/5/17 9:17:16 阅读更多 →

最新新闻

原来网站排名还能“买”到?

原来网站排名还能“买”到?

在传统SEO时代,网站排名确实可以通过竞价排名(SEM)直接“购买”关键词位置,但那种模式本质是付费买流量,一旦停止付费,排名瞬间消失。而在GEO(生成式引擎优化)时代,所谓的…

2026/7/5 2:26:36 阅读更多 →
告别技术空谈:九尾狐AI发布2026年最新企业AI培训体系,主推‘战略到变现‘全周期陪跑模式

告别技术空谈:九尾狐AI发布2026年最新企业AI培训体系,主推‘战略到变现‘全周期陪跑模式

AI短视频矩阵运营:2026企业培训如何实现从战略到变现的全周期陪跑 作为一名长期在一线协助中小企业落地AI应用的博主,我见过太多这样的场景:老板花大价钱请了团队做培训,员工课上听得热血沸腾,回到工位却无从下手&…

2026/7/5 2:26:36 阅读更多 →
西门子S7-1200 PLC轴运动控制配置与优化指南

西门子S7-1200 PLC轴运动控制配置与优化指南

1. 西门子S7-1200 PLC轴运动控制基础架构在工业自动化领域,轴运动控制是PLC应用中最具挑战性的任务之一。西门子S7-1200系列PLC凭借其紧凑的机身设计和强大的运动控制功能,成为中小型自动化项目的首选控制器。这套系统最核心的组件是工艺对象&#xff08…

2026/7/5 2:26:36 阅读更多 →
[MAF预定义ChatClient中间件-05]动态修改ChatOptions和请求消息

[MAF预定义ChatClient中间件-05]动态修改ChatOptions和请求消息

1. 利用ConfigureOptionsChatClient交替使用不同的模型 如下的程序演示了如何利用ConfigureOptionsChatClient中间件来动态地配置ChatOptions的ModelId属性,从而实现交替使用不同的模型来生成响应的功能。如代码片段所示,我们根据OpenAIClient创建了一个…

2026/7/5 2:24:36 阅读更多 →
Linux syslog日志权限出错

Linux syslog日志权限出错

一、Linux syslog日志权限 Linux syslog日志权限出错通常是由于文件权限设置不当或用户权限不足导致的,可通过检查日志文件权限、所有者、用户权限,以及SELinux设置来定位并解决问题。 以下是具体分析和解决步骤: 检查日志文件权限 使用 ls -…

2026/7/5 2:24:36 阅读更多 →
JWT 在线解码、验签、生成一篇讲透:附前端实现、工具架构与在线体验地址

JWT 在线解码、验签、生成一篇讲透:附前端实现、工具架构与在线体验地址

为什么后端说签名不对?HS256、RS256、ES256、PS256 到底怎么切?公钥私钥是 PEM 还是 JWK,到底该贴哪种?改了 payload 之后,怎么重新生成一个能用的 JWT?所以这篇不只讲 JWT 原理,我会直接结合这…

2026/7/5 2:22:35 阅读更多 →

日新闻

B站视频下载神器BiliTools:5分钟学会轻松保存任何B站内容

B站视频下载神器BiliTools:5分钟学会轻松保存任何B站内容

B站视频下载神器BiliTools:5分钟学会轻松保存任何B站内容 【免费下载链接】BiliTools A cross-platform bilibili toolbox. 跨平台哔哩哔哩工具箱,支持下载视频、番剧等等各类资源 项目地址: https://gitcode.com/GitHub_Trending/bilit/BiliTools …

2026/7/5 0:03:34 阅读更多 →
威胁模型全解析:从新手入门到实战应用,助你构建安全产品!

威胁模型全解析:从新手入门到实战应用,助你构建安全产品!

威胁模型的陌生现状在忙碌疲惫的一天里,参与了关于混合后量子密码学的讨论,应付端点攻击找茬的人,还参与留言板讨论后,发现“威胁模型”对多数人仍是陌生概念,且多被当作时髦用语。有趣的相关画作有一幅由 Embyr 创作的…

2026/7/5 0:03:34 阅读更多 →
渗透测试入门指南:从零基础到实战环境搭建

渗透测试入门指南:从零基础到实战环境搭建

1. 从“看热闹”到“入门”:我理解的渗透测试到底是什么?每次看到新闻里说某个大公司的数据被“黑”了,或者某个网站被攻击导致服务瘫痪,你是不是和我一样,心里会冒出两个念头:一是“这黑客真厉害”&#x…

2026/7/5 0:07:38 阅读更多 →

周新闻

B站视频下载神器BiliTools:5分钟学会轻松保存任何B站内容

B站视频下载神器BiliTools:5分钟学会轻松保存任何B站内容

B站视频下载神器BiliTools:5分钟学会轻松保存任何B站内容 【免费下载链接】BiliTools A cross-platform bilibili toolbox. 跨平台哔哩哔哩工具箱,支持下载视频、番剧等等各类资源 项目地址: https://gitcode.com/GitHub_Trending/bilit/BiliTools …

2026/7/5 0:03:34 阅读更多 →
威胁模型全解析:从新手入门到实战应用,助你构建安全产品!

威胁模型全解析:从新手入门到实战应用,助你构建安全产品!

威胁模型的陌生现状在忙碌疲惫的一天里,参与了关于混合后量子密码学的讨论,应付端点攻击找茬的人,还参与留言板讨论后,发现“威胁模型”对多数人仍是陌生概念,且多被当作时髦用语。有趣的相关画作有一幅由 Embyr 创作的…

2026/7/5 0:03:34 阅读更多 →
渗透测试入门指南:从零基础到实战环境搭建

渗透测试入门指南:从零基础到实战环境搭建

1. 从“看热闹”到“入门”:我理解的渗透测试到底是什么?每次看到新闻里说某个大公司的数据被“黑”了,或者某个网站被攻击导致服务瘫痪,你是不是和我一样,心里会冒出两个念头:一是“这黑客真厉害”&#x…

2026/7/5 0:07:38 阅读更多 →

月新闻