日期:2024-10-18 14:59
中新经纬10月17日电 近期,中国信通院对包括GPT-4Turbo、GPT-4O等国际通用大模型,文心一言、通义千问、混元和智谱清言ChatGLM等国内通用大模型,以及灵医Bot、夸克健康助手、讯飞星火医疗大模型和华佗GPT II等医疗健康行业大模型进行了效能评估。通过构建测试数据集、开展符合性验证和模拟实际应用场景,邀请医疗健康、人工智能领域十余位专家形成评估小组,对参测大模型的多轮问询结果进行准确性、完整性、流畅性、可解释性等维度的综合评分,考察大模型在多学科知识问答、多形式语言理解、多场景文书生成、多环节辅助诊疗、多轮对话交