您现在的位置是:母婴 >>正文
趋境科技KTransformers+LLaMA
母婴12人已围观
简介常规LoRA微调千亿模型的成本高达数百万,这让高校、中小型实验室、初创公司甚至个人研发者难以参与。而趋境科技KTransformers与LLaMA-Factory的深度集成,彻底转变了这一现状,为大模 ...
常规LoRA微调千亿模型的成本高达数百万,这让高校、中小型实验室、初创公司甚至个人研发者难以参与。而趋境科技KTransformers与LLaMA-Factory的深度集成,彻底转变了这一现状,为大模型微调给予了低成本、高效率的新挑选。
该方案支撑顾客应用 LoRA 等轻量级微调方法,在极少量 GPU 资产下完成模型定制。经实测,仅占用约 41GB 显存,协作 2T 内存,就能达成 46.55 token/s 的微调吞吐量。关于研发者而言,操作流程也十分简便:只需与此同时安装KTransformers与LLaMA-Factory环境,配置好Kimi-K2的yaml文件并运行,即可开启微调任务。更关键的是,这是目前在花费级显卡上达成微调超大参数MoE模型的唯一可行方案。

在性能对比测试中,KTransformers微调方案长处显著。在较小规模的MoE模型(DeepSeek-14B)测试中,其吞吐速率超出常规方案1.8倍,显存占用较常规方案减少 82%。常规方案多依赖H100等高端 GPU,而KTransformers可支撑4090级花费级显卡,大幅减少了硬件门槛。这一方案让革新门槛显著减少,学术研发领域能尝试更多样化的念头,公司应用层面可针对自身需求迅速微调出定制化模型,且成本和周期大幅缩减,产品迭代更灵活高效
Tags:
相关文章
《暮光双龙》定档1月,娱美德自研新作开启公测预约
母婴12月16日,娱美德Wemade Co., Ltd.)正式宣布,由我国海南研发中心研发的传奇IP正版授权产品传奇之重生:《暮光双龙》现已开启公测预约,将于2026年1月正式上线。《暮光双龙》是继《热血 ...
【母婴】
阅读更多深度专访|全应科技蒙维工程团队解密:97% 自控率怎样攻克化工热电 “非线性强耦合” 痛点?
母婴在化工产业向绿色低碳转型的进程中,热电系统当做能源供应的关键环节,其运行的稳定性与高效性径直关系到公司降本增效与可持久进展的全局。当做全球聚乙烯醇PVA)生产领域的领军公司,内蒙古蒙维科技有限公司曾因 ...
【母婴】
阅读更多撬动海外行当350%增加!精细化联盟佣金真的很“香”
母婴说走就走的旅行、漂洋过海追一场演出、奔向山野来一次徒步......越来越多的花费者正将预算投入到“感受型花费”中。伴随这一动向在全球行当的持久升温,联盟营销正迅速崛起为品牌触达 ...
【母婴】
阅读更多