
文心一言
百度全新一代知识增强大语言模型,文心大模型
AutoGLM的技术演进路径包括GLM-4基座模型、GLM-Z1推理模型、GLM-Z1-Rumination沉思模型和最终的AutoGLM模型。
其中核心链路的模型和技术将于2025年4月14日正式开源,以推动行业生态发展。
AutoGLM是全球首个能够执行Action(行动)的大模型交互智能体,具备跨应用、长距离任务胜任水平。它可以在无干预情况下自动精准执行超过50步智能体任务,已接入智能手机、智能车舱、智能家居、智能办公等多种应用场景。
在具体应用中,AutoGLM可以通过图形用户界面(GUI)自主控制数字设备,适用于Web浏览器和手机等代表性GUI场景。
例如,在Web浏览方面,AutoGLM在VAB-WebArena-Lite上取得了55.2%的成功率,在OpenTable评估任务上达到了96.2%;在Android设备控制方面,AutoGLM在AndroidLab上获得了36.2%的成功率,在流行中国APP中的常见任务上达到了89.7%。
AutoGLM通过RPA(Robotic Process Automation,即机器人流程自动化)的方式实现,基于无障碍服务模拟人类操作。它不需要与厂家直接对接,而是通过安卓的无障碍权限控制来实现操作。
这种技术利用了无障碍权限这一系统级别的API,能够在安卓系统中模拟和执行人类操作,如打开、点击、双击等动作。此外,AutoGLM还具备多模态理解模型、语音模型等技术,使其能够在多种场景下进行精准操作和决策