首:次 用自然语!言解释图神经网络

2025-07-29 13:08:38      来源:华声在线

【导读】GraphNarrator是Emory大学研究团队开发的首个为图神经网络生成自然语言解释的工具。通过构造和优化解释伪标签,再将这些标签蒸馏到一个端到端模型中,使模型能直接输出高质量的自然语言解释,让复杂的图神经网络决策过程变得透明可理解,且在多个真实数据集上验证了其有效性。

图神经网络(GNN)已成为处理结构化数据的核心工具,广泛应用于社交网络、药物设计、金融风控等场景。

然而,现有GNN的决策过程高度复杂,且常常缺乏透明度:为什么模型做出这样的预测?关键依据在哪?这成为阻碍其大规模落地的重要瓶颈。

已有方法多基于「重要子图提取」或「节点-边归因」,如GNNExplainer、PGExplainer等,但它们只能输出结构片段,不具备人类可读性,且缺乏对文本属性节点的处理能力(如文献图、商品图)。

Emory大学的研究团队提出了首个面向图神经网络的自然语言解释生成器GraphNarrator,首次实现从GNN输入输出中,生成高质量的自然语言解释,让图神经网络从「黑盒模型」变为「有理有据的决策体」。

GraphNarrator聚焦于一种重要的图类型Text-AttributedGraphs(TAGs),即节点特征为自然语言文本(如论文摘要、商品介绍、疾病描述等)。

论文贡献包括:

提出首个自然语言解释框架,将TAG图解释从结构层面扩展至语言层;

统一结构化与语言信息,桥接图结构推理与LLM理解能力;

开源工具链,提供高质量伪标签构造器+自监督蒸馏方法,便于迁移至任意GNN任务。

论文第一作者为Emory大学博士生BoPan,长期从事图学习与可解释人工智能方向研究。

共同第一作者为USC硕士生ZhenXiong和Emory大学博士生GuanchenWu,通讯作者为Emory计算机系副教授LiangZhao。

该研究获得ACL2025主会接收,提出首个面向图神经网络的自然语言解释生成器GraphNarrator。

让GNN开口说话

GraphNarrator总体包含三步:

1.构造解释伪标签(Pseudo-labelGeneration)

使用saliency-based解释方法提取「重要文本+关键邻居节点」,形式是每个特征(节点、边、token)的重要性。

将这些结构转化为结构化Prompt,和问题与预测一起输入GPT模型,生成可解释伪标签。

2.优化伪标签(FilteringviaExpert-DesignedCriteria)

通过两大标准筛选质量更高的伪标签:

忠实性(faithfulness):与模型预测一致,研究人员通过互信息(mutualinformation)的方式计算生成的文字解释与输入、输出之间的忠实性。

简洁性(conciseness):信息浓缩、可读性强,鼓励长度更短

GraphNarrator通过专家迭代(ExpertIteration)同时优化这两个目标,确保教师模型(teachermodel)生成高质量的解释。

3.蒸馏解释器(TrainingFinalExplainer)

将伪标签蒸馏进一个端到端模型(文章中使用LlaMA3.18B),直接输入图结构与文本,即可自动输出解释语句。

忠实、可读、用户更爱看!数据集

研究人员在多个真实世界的Text-AttributedGraph(TAG)数据集上对GraphNarrator进行了系统评估,包括:

Cora:论文引文图,节点为论文,文本为摘要

DBLP:作者合作图,文本为论文列表

PubMed:生物医学文献图

对比方法:

各主流LLM(LLaMA3.1-8B、GPT‑3.5、GPT‑4o)Zero-shot生成解释

SMV:基于GPT‑4o的saliency解释模板转换方法

GraphNarrator(基于LLaMA3.1-8B)

评估目标是检验GraphNarrator生成的自然语言解释是否忠实、准确、可读、受用户喜爱。

评测结果

研究人员通过自动方式和人工方式评测该方法生成的解释质量。

自动评测中,GraphNarrator在Simulatability上全面领先(+8‐10%),证明解释内容高度还原了GNN预测;

PMI‑10%覆盖率提升显著(平均+8.2%),表明能捕捉到最重要的token;Brevity(解释长度/输入长度)下降超13%,验证其「短小精炼」能力。

人工评测中,有计算语言学背景的评审从易读性、洞察力、结构信息、语义信息4个方向打分(1–7分制)。

结果表明各项均优于GPT‑4o、SMV,尤其在结构理解上优势明显(+33%),解释更流畅、逻辑清晰,获得真实用户的更高信任。

  张先生告诉《环球时报》记者,近年来走入网球馆和网球场的人越来越多,这一现象在郑钦文夺冠后更加明显,其中尤以青少年人群为多。

责编:资华容编辑

你见过最冷门的姓是什么

  以西安咸阳机场为例,扩建后拥有4座航站楼,航站楼面积高居国内前5。但西安咸阳机场去年旅客吞吐量排在全国第11位,西安去年GDP仅排在全国第21位。

网民用造谣幼儿园通道被堵死

  上述两起事件,引起了一些企业人士的担忧。这些担忧包括是否存在全国性查税,不少企业担忧如果倒查多年需要补税,这对于经营困难的当下无疑是“雪上加霜”。

种地吧

  “台湾民意基金会”今日(6月18日)公布最新民调,台湾地区领导人赖清德声望为48.2%,相较上个月重挫 9.8 个百分点。该基金会董事长游盈隆表示,在台湾,一个百分点代表 19.5 万人,10 个百分点代表近 200 万人,上任不到一个月,流失近200万人支持,是一个严重的警讯。

胡楚靓

  西安咸阳机场T5,与北京大兴机场、成都天府机场航站楼面积相当。三座机场中规模最小的兰州中川机场T3,面积也相当于上海虹桥机场两座航站楼之和。

美媒曝哈梅内伊正藏身地堡避险

  随着参与网球运动的人逐渐增多,中国网球的基础设施也在不断完善。纪宁告诉《环球时报》记者:“我们在做一个项目,在北京朝阳区规划一个‘大满贯网球文化公园’,将汇集所有大满贯要素。人们既能在此观看全球顶级赛事,也能在场地上训练和比赛。”纪宁说,这仅是一个案例,但从中可以窥见中国网球运动基础设施越来越完善,也越来越专业化。作为体育产业的参与者与观察者,纪宁表示,不仅北京,全国各地网球运动设施也发展得越来越好。

马景涛直播晕倒

  阿里巴巴向《环球时报》记者提供的数据显示,郑钦文的球拍、潘展乐的泳镜……这些冠军同款装备已登上淘宝热搜,卖爆天猫。其中郑钦文夺冠同款网球拍高居淘宝热搜第一名。自8月3日郑钦文夺冠至8月5日樊振东夺冠,其间超200万人在天猫搜索了“小球”品类相关商品,其中网球相关装备搜索量同比增长300%,“郑钦文同款”专业网球拍V14,48小时内收到了超4万人的问询,超3000人加购,成交量同比暴涨超2000%,成为天猫网球类目成交TOP1商品。不仅如此,就连郑钦文夺冠现场教练穿的“加油服”也火出圈。/p>

内蒙古通报那尔那茜有关核查情况

  但随着税收征管能力不断强化,税收征收率不断提高,企业实际税负正在逐步接近名义税负,在当前经济形势下,企业痛感会更明显,一些企业如果不能承担可能会选择停业,这不仅影响就业,更会对宏观经济运行带来负面影响。/p>

朱志鑫苏新皓家属感好重

  春秋旅游副总经理周卫红表示,随着更多客源地的境外游客得以通过更便捷的方式来到中国,了解、感受中国的开放态度、全球胸怀,旅游企业也将结合更多体验性的文化内容,设计丰富多样的出入境游新品。同时,澳大利亚、新西兰也有着很多华人华侨,单方面免签的推出,在方便他们回国探亲访友之余,同时也可以通过旅游,来看看中国发生的深刻变化,体验丰富多彩的生活和文化。