Anthropic于5月29日发布开源东西“思想追寻”(Circuit Tracer),思想追寻经过构建“归因图”以图形化方法展现AI大言语模型的源东语模决议计划进程 。
该东西由Anthropic Fellows与Decode Research团队联合开发,西可型内支撑研讨者交互式探究模型内部机制,视化标示 、部逻共享图表 ,思想追寻并调整参数验证假定 ,源东语模旨在提高AI的西可型内可解释性与安全性 。
现在,视化Circuit Tracer已作为开源库登陆GitHub,部逻用户可经过Decode Research运营的思想追寻Neuronpedia渠道拜访交互前端 。
Anthropic着重,源东语模开源此类东西将加快社区对言语模型行为的西可型内了解,补偿当时AI内部研讨滞后于功用开展的视化现状 。
部逻