T/CWAN 0175-2026 焊接大语言模型的评价方法

团体标准 · 2026-1-11 16:13:12

本文件规定了焊接大语言模型(welding large language model,Weld LLM)的评价原则、评价维度与指标体系、数据集构建方法、评测流程、评分与等级划分方法、检验记录要求,并提供了评价报告格式。
本文件适用于以自然语言处理为核心的焊接大语言模型的评价,包括通用型大语言模型在焊接领域的能力评估,以及面向焊接领域开发的专用大语言模型性能测试与验证。
本文件不适用于对非自然语言处理类的焊接人工智能系统(如基于规则的专家系统、单纯的图像识别算法)的独立评价,但可为此类系统与LLM 融合后的整体性能评估提供参考。

标准编号：T/CWAN 0175-2026
标准名称：焊接大语言模型的评价方法
发布部门：中国焊接协会
发布日期：2026-01-07 00:00:00
实施日期：2026-02-01 00:00:00
文档格式：PDF
文档页数：13页
文档大小：1.31MB

标准全文下载：

上传的附件：

TCWAN 0175-2026 焊接大语言模型的评价方法.pdf (1.31 MB, 下载次数: 0)

封面截图如下：

		自动登录	找回密码
密码			立即注册

T/CWAN 0175-2026 焊接大语言模型的评价方法

相关帖子