阅读历史 |

第138章 方案顺利通过验证(1 / 2)

加入书签

第138章方案顺利通过验证

“老婆,你先带着女儿玩一会儿,我去书房处理点儿工作,就一会儿!”思路涌来,郝成回到家不工作的承诺又要食言了。

“十点!”宁荟能怎么样呢,还不是得由着他。

“用不了,最多一个小时!”郝成伸出一根手指指着灯:“我保证!”

“德性!”宁荟笑骂了一句,心里也是感叹:忙点就忙点吧,至少比起去年,这看起来开朗了许多。

……

今天确实不费什么脑筋,因为相关的知识早就在从前整理过了,只是当初没有重视。

来到书房,稍微翻一下之前记录下来的东西,郝成的思如泉涌,一下子就全都冒了出来。

如果说模型的训练提升是在做加法,让模型变得更大更强,那裁切、量化、蒸馏就是在做减法。

很多人可能会有疑问,做减法,那不是让模型变得更弱了吗

理论确实是这样,但有时候,弱不弱的其实不是特别重要,只要使对了劲儿,一样能造的嗷嗷叫,发挥很大的作用。

比如,有些神经元节点的权重非常小,对模型加载信息的影响微乎其微,切掉它们,精度不会降太多,但却能大大的减少资源消耗。

还有,像小沙这样全量全知全能的模型,其部署和每一次的相应运算推理,都需要消耗较大的算力资源。但事实上,每一次都是确有必要的吗

显然并不是!

就拿小沙现在应用最广的软件开发能力来说,它就只需要精准需求的理解以及代码编写能力就够了,至于慢慢在增强的情感映射、主观判断等能力映射这些,那就完全没有必要!

不仅消耗了更多的算力,还拖慢了相应速度。

而且即便是需要的部分,也可以分层去处置:

还是拿软件开发能力来说,最粗略的,那就可以分为两部分:一部分是需求理解,另一部分是根据需求去做开发。

而这第二部分,那就只需要一个“软件开发”的行业模型就够了。

所以,先在输入端就将用户需求分解,然后将小沙按需裁切为软件开发、法律服务、安全服务等小模型,根据分解的需求去调用其中一个,或者几个。

就比如之前被视为经典案例的小沙第一次庭审,那次的应对也不过是需要三个基础能力:语义理解、法律服务、软件开发能力。

只有极少数的情况,才需要去动用小沙的全量模型。

即便需要全量模型,全程调用全量模型,和只在有需要的步骤去调用全量模型,消耗的资源也是大相径庭的,但结果可能是一模一样。

……

“训练提升难住我了,裁切蒸馏还不是手拿把掐!”

深夜课堂学了这么久,郝成还是有几把刷子的,微意识体的模型训练力有未逮,但压缩郝成还是有办法的。

更何况,郝成还有小沙这个绝佳的辅助工具。

↑返回顶部↑

书页/目录

都市言情相关阅读: 我还真是幻觉? 红楼:割据江东,从水匪开始 星路仙踪 从烂仔到黑道枭雄 给食戟来点万界食材 骑士:极限爆装系统 仙道轮回劫 万族大祭,剑修斩神,符箓封天 普通人的重生日常 东东日记:光阴十二载 清穿:成为太子妃后被娇宠了 闹呢?让你契约亡灵,你契约将臣 阿姨,女儿就交给我吧 拒绝精神内耗,平等创亖所有人 我的小岛会变色 人在传奇:我把技能带回现实! 无限:被迫参加无限流我成神了 科普精灵,七神来凑热闹! 身为黑暗奥:揍光之巨人很合理吧 笙书传 梦想成真却是1958 穿越影视剧吃瓜 快穿之梦琪琪 穿越成丐帝 开局被噶99次,我直接原地发疯 我一宗门宗主,你给我暴兵系统? 我卡牌大师,制作神魔卡 战神龙王凌羽 新欢闹上门,明小姐消失后司总悔疯了 人在末世,我能联通现实 桃花雨与观音露的邂逅 我眼中的宇宙世界 尤物诱情 开局:从一本残经开始 末世投资,女神给我打工 水浒风云大宋头条好汉 穿越成宇宙大帝的我只剩一个头 北周崛起:杨坚你休想篡朕的皇位 帝王系制卡,从始皇帝嬴政开始 穿越六零,带着妹妹去下乡 双穿明末:我带领大明统治全球 所有人偷听我心声改变悲惨未来 四合院:行放纵事,享肆意人生 快穿:漂亮炮灰真的不是万人嫌 昆仑客栈 你就是我的天堂 修仙:从拥有灵植空间开始 穿古养崽路七娃难管束 灵界搅屎棍 我的背后灵是帝皇 穿越年代:卷!从小山村开始 女皇穿越之后当了内娱判官 渣女快穿系统之来回穿越 九个姐姐宠溺我独爱 四合院:从捡破烂,到时代传奇 快穿恶女:男主通通虐哭惹人怜 绑定仙农空间:我选择回村种田 见面后,我们的友情逐渐变质 断亲后,我在荒野世界嘎嘎乱杀 朱雀鸣