AIGC,ChatGPT以及今天发布的GPT-4
相信已经给大家带来足够的冲击,那么
对于知识图谱的应用产生哪些变化和变革?
知识图谱在其中如何发挥作用呢?
通过LLM是否有可能辅助创建通用大规模知识图谱?
AIGC时代下行业知识图谱的新机遇有哪些?
2023年3月18日,DataFunSummit2023:知识图谱在线峰会将试着给你答案!
本次峰会由2位主席与3位专家团成员和6位论坛出品人精心策划而成,共包含了:统一知识表示与复杂推理、大规模知识图谱构建与更新、海量知识存储与计算、知识问答与推荐、知识图谱与AIGC、最佳行业知识图谱实践等6大论坛,邀请20余位来自一线的知识图谱专家学者,进行深度分享交流。本次峰会将全程直播,欢迎大家扫码免费报名收看:
识别二维码,免费报名
▌峰会日程
▌峰会组织
峰会主席
学术主席:刘铭 哈尔滨工业大学 教授、博士生导师
个人介绍:刘铭,教授/博士生生导师,哈尔滨工业大学计算学部。先后主持国家重点研发计划项目(课题)、国家自然科学基金、中国博士后科学基金特别资助、中国博士后科学基金面上资助一等资助、黑龙江省面上基金、教育部协同育人项目多项基金项目。获黑龙江省科学技术一等奖,哈尔滨市科技成果,第六届全国青年人工智能创新创业大会一等奖。近年来以第一作者或通讯作者发表 CCFA/B 类论文20余篇,包括 TKDE、TOIS、KAIS、IJCAI、ACL 等知名学术刊物或会议上,英文译著一部。担任 NLPCC2020、CCKS2020 知识图谱领域主席,CCKS2019 出版主席、CCKS2021 评测主席、CCKS2022 讲习班主席和 CCKS2023 程序委员会主席。
工业主席:王士进 科大讯飞 AI研究院 常务副院长
个人介绍:王士进博士,科大讯飞研究院常务副院长、认知智能国家重点实验室副主任。他带领团队陆续开展了自然语言处理、智慧教育、人机交互等技术方向研究,取得一系列国际领先的研究成果,获得30余项国际比赛冠军,在 TASLP、AAAI、ACL、KDD、SIGIR 等人工智能领域国际顶级期刊和会议上发表论文50余篇,申请了专利80余项,同时还承担了国家重点研发计划、863、973等多项国家重点研发计划工作,获安徽省科技进步一等奖、吴文俊人工智能科技进步奖一等奖等奖项。
专家评审团
洪春涛 蚂蚁集团 图数据库负责人
个人介绍:洪春涛博士于2011年毕业于清华大学计算机系,主要从事并行计算和高性能计算研究;后加入微软亚洲研究院从事分布式系统和大规模机器学习研究;2016年联合创建了北京费马科技有限公司,研发了TuGraph图数据库;2020年加入蚂蚁集团,目前主持蚂蚁图数据库研发。
彭卫华 华为终端 智能决策首席专家
个人介绍:曾在百度、阿里、腾讯等互联网企业工作,长期从事搜索、推荐、自然语言处理、知识图谱等研究工作,在ACL、EMNLP、COLING、KBS等知名学术会议&期刊发表论文20余篇,有着十余年的工业界实战经验。
王昊奋 同济大学 百人计划、特聘研究员、博士生导师
个人介绍:王昊奋,同济大学百人计划,特聘研究员,博士生导师。长期在一线人工智能公司担任CTO之职。他是全球最大的中文开放知识图谱联盟OpenKG发起人之一。他负责参与多项国家级AI相关项目,发表100余篇AI领域高水平论文,被引用次数达到2600余次,H-index达到23。他构建了全球首个可交互养成的虚拟偶像—“琥珀·虚颜”;所构建的智能客服机器人已累计服务用户超过10亿人次。目前,他担任中国计算机学会术语工委副主任,SIGKG主席,上海秘书长,中国中文信息学会理事,语言与知识计算专委会副秘书长,上海市计算机学会自然语言处理专委会副主任,上海交通大学AI校友会秘书长等社会职位。
▌详细介绍
① 统一知识表示与复杂推理
知识是一个理解世界的窗口,很多结构化和非结构化的内容都被收集到知识图谱中,形成知识库。本论坛的主旨是探索如何表示复杂的知识,理解其中的逻辑关系,并且基于知识图谱进行复杂推理,其中复杂推理是此次论坛的重点探索方向。我们很荣幸邀请了顶级学府和企业的学者们来分享几个方面的研究工作:1) 知识图谱表征学习和复杂推理;2) 图神经网络在知识图谱领域的最新进展;3) 知识图谱和自然语言模型的融合。通过分享,我们将会收获最新的基于知识图谱进行复杂推理的方法,包括因果推理,基于神经符号的离散推理,多跳推理等,同时了解到最前沿的图神经网络设计,包括子图学习,隐式图神经网络设计等。
出品人:商超 Amazon 应用科学家
个人介绍:商超,现就职于 Amazon,担任应用科学家,之前就职于京东硅谷研究院。他的研究主要集中在图神经网络和自然语言处理,近期致力于知识图谱表征学习和基于知识图谱的问答系统设计等相关研究。
孟媛 清华大学 博士后
孟媛,清华大学计算机系博士后,主要研究方向为因果发现,泛化推理,系统运维诊断等,在INFOCOM,USENIX ATC,TON等国内外顶级会议及期刊发表论文11篇。
演讲题目:浅谈知识图谱的关联视角和因果视角
演讲提纲:As a structured semantic knowledge base, the current knowledge graph is often used to represent the "correlation" relationship between entities in the physical world. Many studies focus on the completion of missing facts of the knowledge graph, which is treated as a collection of facts in applications. How to advance from fact completion to fact reasoning is an important fundamental problem for in-depth analysis and utilization of knowledge graph. This talk will introduce the perspective of "causality" based on the knowledge graph's correlation expression, provide an explanation for the correlation relationship among entities by discovering the causal relationship and pattern at the conceptual layer of the knowledge graph, and achieve traceable intelligent reasoning for unknown environments and unseen entities.
鲍军威 京东科技 算法科学家
个人介绍:鲍军威,哈尔滨工业大学博士学位,13年NLP从业经验,2011-2018于微软亚洲研究院联培,2019-至今作为算法科学家就职于京东科技。主要研究方向为自然语言处理,对话问答,文本生成、预训练语言模型等,曾获多项对话问答Leaderboard第一名,已发表论文20余篇。曾参与微软小冰、Bing的知识问答系统研发,主持京东商品自动营销文案写作项目研发,参与京东零售、京东金融智能客服相关系统研发,目前主要从事基于言犀平台的京东自研大模型的研发。
演讲题目:基于知识的神经符号结合的离散推理研究
演讲提纲:在需要推理的问答领域,传统基于符号的语义解析式离散推理方法具有更好的可解释性,而近几年的基于神经网络的端到端式离散推理方法在性能上取得更好的成绩。因此,如何将神经符号两类方法结合,研究具有可解释且高性能的离散推理能力的问答系统成为本领域的一大研究方向。本演讲主要介绍我们在基于无结构化文本知识、文本与结构化表格混合知识的离散推理型问答研究方面的工作,包括引入离散操作来提高神经网络方法性能、基于神经网络预测可执行的逻辑表达式等方法,引导大家持续推动基于知识的神经符号结合的离散推理研究。
听众收益:
1. 如何引入符号化的离散操作来提高神经网络的推理性能?
2. 基于神经网络生成逻辑表达式的性能到底如何?
3. 基于大模型的零样本/少样本推理现状如何?
杨栋 OPPO研究院 高级研究员
个人介绍:杨栋,OPPO研究院语音语义部融智Lab高级算法研究员。他毕业于香港城市大学博士,现在主要研究方向是自然语言处理,图学习网络,预训练模型,网络研究和应用,致力于使用简单方法解决复杂的实际问题。近期,他主责部门知识增强预训练模型和知识图谱多跳逻辑推理等算法开发。主导构建预训练模型CHAOS, 登顶CLUE 三大榜单。在知识图谱多跳推理上,提出GammaE 模型,论文被EMNLP2022 会议Oral Presentation 录取。
演讲题目:知识图谱和自然语言处理
演讲提纲:杨栋,OPPO 研究院语音语义部融智 Lab 高级算法研究员。他毕业于香港城市大学博士,现在主要研究方向是自然语言处理,图学习网络,预训练模型,网络研究和应用,致力于使用简单方法解决复杂的实际问题。近期,他主责部门知识增强预训练模型和知识图谱多跳逻辑推理等算法开发。主导构建预训练模型 CHAOS, 登顶 CLUE 三大榜单。在知识图谱多跳推理上,提出 GammaE 模型,论文被EMNLP2022 会议Oral Presentation 录取。
听众收益:
1. 介绍预训练大模型 CHAOS
2. 介绍知识图谱逻辑推荐
张永祺 第四范式 算法科学家
个人介绍:张永祺博士于2020年加入第四范式科学技术部,现担任算法科学家,负责机器学习和知识图谱相关的研究工作。工作期间他开展了多个知识图谱学习相关工作,在链接预测、实体对齐等任务基线上达到国际领先水平,取得大规模生物知识图谱预测任务ogbl-biokg第一名的成绩,并以第一作者在TPAMI, VLDB Journal,NeurIPS, WWW, ACL, ICDE等人工智能领域顶级会议期刊发表近10篇高水平论文。他于2020年在香港科技大学获得博士学位,2015年在上海交通大学获得学士学位。
演讲题目:基于图神经网络的知识图谱推理
演讲提纲:知识图谱作为一种特殊的结构化数据,启发了如搜广推医疗金融等诸多领域下游应用,对数据挖掘和机器学习具有重要意义。近年来,随着图神经网络(GNN)的发展,越来越多的GNN应用于知识图谱推理场景,获得了出色的推理效果。本次分享从信息聚合到子图学习两代技术的角度,介绍GNN在知识图谱推理领域的发展和重要工作,展示当前GNN+KG的重要应用场景,对当前子图学习技术优势及其瓶颈进行讨论。
听众收益:
1. 知识图谱上的图神经网络建模有何特殊之处?
2. 知识图谱推理有哪些重要应用?
3. 图神经网络知识推理的难点在哪?
刘俊成 新加坡国立大学 博士研究生
个人介绍:新加坡国立大学博士研究生,研究方向为图神经网络,文章发表于NeurIPS, WWW, KDD, AAAI, VLDB等顶会。
演讲题目:隐式图神经网络的介绍与进展
演讲提纲:本次演讲主要介绍隐式图神经网络,以及目前的进展。包含两篇NeurIPS的论文具体介绍。
听众收益:
1. 什么是隐式图神经网络?
2. 图神经网络如何获取长距离依赖?
3. 现有隐式图神经网络的缺陷是什么?
识别二维码,免费报名,预约本论坛直播
② 大规模知识图谱构建与更新论坛
知识图谱技术门槛高、构建成本大、投产周期长一直是知识图谱应用所面临的难题,随着AIGC和LLM相关技术的突破,为知识图谱的建模、抽取、补全和融合等步骤均提供了有效支撑,将进一步推动知识图谱的高速应用。本次论坛特别邀请了来自电商、金融和传媒领域的专家,详细讲述相应领域中知识图谱从构建、更新到运营、应用的全流程;同时还邀请了国内最早专注于研究知识管理的专家,讲述知识图谱驱动的新一代知识管理。通过本次论坛,听众可详细了解知识图谱在不同行业中是如何有效地构建、应用与赋能的,以及大规模知识图谱相关技术是如何带来知识管理的自动化与智能化升级的。
出品人:胡芳槐 PlantData CTO
个人介绍:博士,PlantData CTO。10年知识图谱研究及产业化经验,数个国家级项目骨干成员,ISWC、CCKS2017等国际会议、顶级期刊发表多篇论文及实战报告,知识图谱全生命周期理论提出者。国内最早研究中文知识图谱构建并进行产业化探索,于2012年谷歌提出知识图谱概念之前即发布了基于中文百科的通用知识图谱(SSCO);多次受邀参与行业顶级交流报告,于CCKS2017知识图谱实战报告,首次提出了行业知识图谱的生命周期并逐步成为业界的标准,迭代研发了适用于千亿级别三元组存储以上的知识图谱数据存储套件,设计了面向企业级复杂数据场景的统一知识表示方法。现任PlantData CTO,已与中国电科、中航工业、国家电网、华为、招商证券、中国银行、中信建投等数家行业标杆企业达成合作。
张亦弛 Shopee,Listing Intelligence Leader
个人介绍:张亦弛,现任电商平台 Shopee Listing Intelligence 商品算法负责人,服务全球十余个市场的商品智能化识别,工作研究方向为电商领域知识图谱构建、自然语言处理和多模态技术在电商业务中的应用等。毕业于伦敦大学,学术论文曾发表在 BMVC / EMNLP / WSDM / CVPR 等国内外会议和期刊,出版专著一部。
演讲题目:Shopee 多语言商品知识图谱技术构建方法和应用
演讲提纲:
1. 商品知识图谱简介:电商商品知识图谱概要和应用场景(ToB&ToC)
2. Shopee 商品知识图谱的构建:Shopee 商品知识图谱构建技术,包括知识建模技术、知识获取技术、知识融合技术和知识推理技术等。通过自动化的实体挖掘、实体抽取、实体链接等,实现了在全球十多个多语言市场真实商品语料上的技术沉淀,并通过这些技术首次在工业界搭建和实现了整个市场全自动化标准产品库(SPU)的数据生产和应用。
3. Shopee 商品知识图谱的应用:Shopee 电商知识图谱生产的标准产品库(SPU),重点应用在比价营销会场,其应用场景还涉及商家系统、运营系统以及面向消费系统的智能化。
4. 商品知识图谱的未来:随着 Shopee 海外市场的深耕,精细化地提升知识图谱技术在各个市场和混合语言环境下的识别水平,不断通过新技术突破业界识别水平的天花板,让 Shopee 的商品系统更加智能,商家的全球化经营更加便捷,消费者购买体验更佳。
听众收益:
1. 了解到商品知识图谱技术在全球多语言市场应用的实际经验;
2. 了解到商品知识图谱技术在工业界应用的挑战和难点;
3. 了解到如何管理技术项目打造知识图谱技术,服务于自己的业务应用。
夏敬华 PlantData 海乂知 CKO
个人介绍:同济大学博士后,海乂知CKO,中国知识管理主要倡导和推动者,中国知识管理国家标准主要参与制订者,在知识管理、知识图谱、人工智能应用等方面具有丰富经验,曾为数百家企业提供企业数智化转型培训、咨询和系统实施落地。
演讲题目:基于知识图谱的数字化知识管理新实践
演讲提纲:数字化转型浪潮下,组织知识同样需要数字化转型,传统知识管理存在“重沉淀、轻应用”、“多人工、少智能”等问题,难以满足数字化时代的知识管理要求。基于知识图谱的数字化知识管理,不仅实现知识采集、加工、存储、共享等过程的智能化支撑,更将知识和业务、岗位、用户行为特征等有效关联,构建场景驱动的知识应用,可以显著提升知识业务粘性、加深知识应用深度、增强知识服务能力。
徐德华 翼支付 风险管理部总监
个人介绍:翼支付风险管理部总监,模型团队负责人,负责支付、电商、金融、通讯反诈等风控模型体系建设。
演讲题目:知识图谱和图计算在翼支付风控的应用
演讲提纲:
1. 图谱简介
2. 翼支付风控知识图谱“云篆”简介
3. 图计算在风控业务中的应用
张涛 英大传媒 编审
个人介绍:全国新闻出版行业领军人才。长期从事电力图书策划出版工作,探索传统出版数字化转型。7次获得中国出版政府奖图书提名奖、国家出版基金等国家级奖项,主持数字平台获得3项国家奖项和荣誉,15次获得全国优秀畅销图书奖、中国电机工程学会科普作品奖等省部级奖励。
演讲题目:电力行业知识资源建设及场景化应用
演讲提纲:结合电力行业知识资源类型和应用场景,利用知识图谱技术,实现多源数据的融合和关联,为个人成果汇总、岗位培训、知识学习、信息情报收集等应用场景提供支撑和共享平台。
识别二维码,免费报名,预约本论坛直播
③ 海量知识存储与计算论坛
随着知识图谱在各行各业越来越普及,场景复杂性和数据规模在近年来呈爆炸式增长。与其同时,数据的存储和计算也成为系统设计的巨大挑战。本分论坛基于“海量知识存储与计算”的主题,邀请了国内外走在知识图谱领域前沿的企业负责人,对图技术进行了深入的探讨。本论坛的话题侧重与技术分享,从图存储开始,介绍一个优秀的图存储的考量和实践;接着介绍图查询语言,讨论了在金融实践中会碰到的问题及解决方法;然后给出了在目前图标准并未完全普及的情况下,一些实用的上手要点;最后是一个万亿级金融知识图谱的数据管理平台技术分享。
出品人:林恒 蚂蚁集团 图数据库开源负责人
个人介绍:2016年联合创立费马科技,主要负责图计算架构与解决方案;2018年10月于清华大学获得博士学位,研究方向为超大规模异构图计算;2020年12月起加入蚂蚁集团,目前负责 TuGraph 开源图数据库。
周研 创邻科技 CTO
个人介绍:浙江创邻科技有限公司联合创始人。分布式数据处理领域技术专家、Apache 开源项目贡献者、图数据库和图计算领域专家、Galaxybase 图数据库产品研发负责人。
演讲题目:基于图数据库的知识图谱存储技术及实践
演讲提纲:
1. RDF 和属性图
2. 图数据库存储的核心目标
3. 图数据库存储的主流方案
4. Galaxybase 图数据库应用实践
听众收益:
1. 图数据库和关系型数据库存储的本质区别是什么?
2. 常见图数据库存储技术方案有哪些?
彭志伟 蚂蚁集团 技术专家
个人介绍:蚂蚁图计算GeaFlow DSL方向负责人,Apache Calcite/Hudi Commiter,多年实时计算和分布式SQL引擎研发经验,目前专注图计算DSL研发方面工作.
演讲题目:蚂蚁金融场景下图表融合分析语言实践
演讲提纲:蚂蚁金融风控等场景对图计算提出了多样化的计算需求,包括实时图计算、离线图仿真等。如何通过一套图分析语言来满足不同场景下的图计算需求是我们面临的重要挑战。我们从实际的业务场景出发,提出并实现了一套图表融合的分析语言,很好的解决了复杂图计算需求,降低了用户使用图计算的门槛。本次分享将介绍图表融合DSL的设计、复杂图查询的分布式化、查询优化以及相关应用务场景介绍等多方面的内容。
听众收益:
1. 了解图计算的典型使用场景
2. 了解图分析语言的现状和面临的挑战
3. 了解蚂蚁图表融合 DSL 解决方案
孙宇熙 Ultipa CEO
个人介绍:高性能计算与存储系统专家、大数据专家、数据库专家及学者;毕业于清华大学计算机科学与技术系和圣塔克拉拉大学计算机工程系;现任Ultipa CEO;曾任EMC(易安信)亚太研发集团 CTO 和中国研究院院长、哈尔滨工业大学客座教授、中国电子学会云计算专家委员会委员、收藏家,哈佛大学美术馆亚洲艺术鉴赏委员会理事;技术科普作家,著有《图数据库原理、架构与应用》《图算法(筹)》《云计算与大数据》《软件定义数据中心》《大数据分析》《银行数字化转型》《程序员生存手册》(The 99 Points of Launching High-Tech Business)等多部中外科技畅销书。
演讲题目:图数据库查询与算法正确性验证
演讲提纲:
· 面对市场上不断涌现的图数据库、知识图谱产品,你想知道它们底层的实现逻辑吗?
· 不同厂家推出的纷繁复杂的评测报告,你知道如何精准地解读吗?
· 你知道如何选型图数据库并进行结果正确性验证码?(显然结果出现错误并非个例,而这会造成一系列问题)
本讲座以无保留、系统化、直观清晰的方式向听众介绍图查询结果的正确性验证方法。
验证方式主要分为三个部分(步骤):
1. 溯源验证:如何通过对源数据下钻来进行结果正确性验证
2. 工具验证:如何通过不同的命令行、可视化操作界面进行验证
3. 编程验证:如何通过图查询与操作语言来进行各类查询(包含算法)的实现与白盒化验证。
掌握这些验证方法后,你会发现很多厂家的图技术产品的查询与分析的实现逻辑、结果,甚至数据建模与入图方式都存在一些问题,而有些问题是根本性与灾难性的,另一些则是需要作为bug来修复—— 而你此时对于图数据库的知识掌握相信已经超越大多数人了。
听众收益:
1. 你知道如何验证图查询与操作的结果是否正确吗?
2. 你知道怎么去分析和评价每家图数据库厂商的评测结果吗?
3. 你知道每个图查询与操作背后的原理与拆解吗?
4. 你知道如何评价与选型图数据库吗?
5. 深入浅出带你揭开图数据库的迷雾
易鹏 蚂蚁集团 高级技术专家
个人介绍:11年毕业于西安交通大学,计算机硕士,现任蚂蚁集团高级技术专家,负责蚂蚁知识图谱的构建引擎团队。之前在百度担任搜索资深研发工程师,经历了搜索数据架构的规模化和实时化演进,18年加入蚂蚁,从0到1构建了万亿级金融知识图谱的数据管理平台。
演讲题目:大规模语义知识管理实践
演讲提纲:企业级语义化知识管理,以图的方式来组织数据,表示多源异构知识,并结合业务专家经验,实现数据到知识的标准化生产,可以有效连接不同业务领域数据,实现知识复用,减少数据冗余。蚂蚁知识图谱平台,实现了万亿级知识管理,并持续推进支付、安全等多个金融领域知识的语义化迭代,来促进业务数据融合互联。本次分享的主要内容包括:
1. 蚂蚁知识图谱平台介绍
2. 语义化知识管理的关键技术
2.1 语义知识表示
2.2 语义知识存储
3. 知识互联的业务场景
听众收益:
1. 了解蚂蚁集团知识图谱平台建设现状
2. 了解语义化知识管理,在知识表示、规模化存储和图谱融合等关键技术上的实践
3. 了解知识互联在金融领域的业务应用经验
识别二维码,免费报名,预约本论坛直播
④ 知识问答与推荐论坛
随着 ChatGPT 的兴起,让更多人关注人工智能的前沿发展,在 AIGC 的风潮下,知识图谱应用将走向何方值得从业者深度思考,本次我们讲分享知识图谱在工业应用场景下实际落地的各类方案,从问答,搜索,推荐等应用视角重新审视知识图谱本身技术发展。汇报嘉宾中,既有电网智研院,电子四院,从研究院所视角分析行业建设方案,也有货拉拉,58这样的互联网公司从自身应用视角分析图谱结合方案,同时还有百度阿里这样的从平台视角建设图谱可行性方案,希望通过这样的分享,帮助听众更全面了解知识图谱前沿技术是如何赋能行业,实现应用落地。
出品人:杜振东 云问科技 NLP 研究院负责人
个人介绍:云问科技NLP研究院负责人,拥有8年机器学习与文本挖掘相关技术经验,6年中文自然语言处理相关项目实战经验。编写书籍《会话式AI》、《人工智能实践录》与《江苏省新兴产业战略丛书-人工智能分册》;参与制定国家人工智能标准化总体组《人工智能标准化与开源研究报告》、《人工智能-术语》、《人工智能-情感计算用户界面框架》;参与制定中国电子工业标准化技术协会《信息技术 人工智能 智能助理智能能力等级评估》;入选国家标准委人工智能专家及AIIA人工智能技术专家。参与百万级用户金融资讯新闻推荐项目,作为算法主要负责人及整体框架设计者,主导全新智能新闻推荐系统的落地,并优化线上推荐算法,整体线上相较原有系统精度提高10%。主要设计面向任务驱动的多轮对话引擎,主导参与搭建NLP底层能力平台,为企业提供底层能力的服务输出。参与多家企业问答机器人系统、知识图谱系统搭建,针对集团型知识管理与问答效果优化有丰富实战经验。
王立玺 中国电子技术标准化研究院 标准创新服务中心 副主任
个人介绍:王立玺,中国电子技术标准化研究院标准创新服务中心标准智能服务研究室负责人/高级工程师。长期从事电子信息技术领域标准科研工作,主持了“电子信息领域标准大数据公共服务平台”、“面向疫情防控和复产复工的标准知识图谱智能服务平台研发和应用”等多项省部级科研项目。近年来,主要致力于标准数字化、标准知识图谱相关理论、技术、应用研究,突破了一系列关键技术。授权《标准知识图谱构建、标准查询方法及装置》等标准知识图谱相关专利5项,软件著作权十余项。
演讲题目:标准数字化关键路径–标准知识图谱的构建与应用
演讲提纲:
1. 标准知识图谱概述:什么是标准化,标准知识图谱的内涵与外延
2. 标准知识图谱的建设与研究现状:标准知识图谱的建设阶段、主要内容、技术路径以及现阶段建设情况。
3. 标准知识图谱的应用方向探讨:在标准化专业的垂直应用、横向赋能各行各业、截至目前已经探索的应用场景。
听众收益:
1. 在标准化数字化大背景下,知识图谱技术的建设与应用现状。
2. 未来一段时间内,如何打破专业壁垒,让知识图谱技术快速在标准化专业中快速应用发展。
江悦 阿里巴巴 算法工程师
个人介绍:2020年毕业于南京大学,同年加入阿里巴巴担任算法工程师,在企业智能事业部负责搜索 Query 理解相关工作。
演讲题目:基于知识增强和预训练大模型的 Query 意图识别
演讲提纲:
1. 基于知识增强和预训练大模型的 Query 意图识别的场景
2. Query 意图识别架构介绍
3. 基于知识增强和预训练大模型的 Query 意图识别
4. 总结&思考
听众收益:
1. 了解企业级搜索的 QP 建设
2. 如何基于知识增强进行超短文本 Query 的意图识别
3. 基于预训练大模型的 Query 意图识别实践
李亮 百度智能云AI应用产品部 解决方案总监
个人介绍:从事电网和发电行业信息化工作10+年,具有丰富的电网调度、电力交易、发电场站智慧化建设整体规划和项目管理经验,目前主要负责百度知识中台在能源方向的整体解决方案。
演讲题目:基于知识图谱、NLP与大模型技术的企业智能搜索与知识应用平台建设
演讲提纲:
1. 百度对知识中台的理解和观点
2. 百度知识中台整体解决方案
3. 基于知识中台的应用场景
听众收益:
1. 如何通过知识体系建设助力企业数字化转型
2. 知识中台重要建设过程和核心技术点
3. 知识中台的典型应用场景和行业案例
刘同阳 国网智能电网研究院 计算及应用研究所 研发工程师
个人介绍:工学硕士,国网智能电网研究院,计算及应用研究所 AI 电力认知计算团队成员,从事电力智能问答,电力生成式大模型等方向研发工作。
演讲题目:电网主设备知识计算关键技术及工程应用
演讲提纲:介绍了电网主设备知识计算的技术方案、关键步骤,以及在国家电网实际场景中的应用情况。
听众收益:
1. 电网主设备知识计算是什么?
2. 国网设备管理数字化场景中存在哪些难题?
3. 实现电网主设备知识计算的关键步骤有哪些?
4. 电网主设备知识计算如何有效赋能一线检修班组?
桑海龙 58同城 AI Lab 算法资深工程师
个人介绍:桑海龙,58同城 TEG-AI Lab 算法资深工程师,智能客服算法负责人,2019年10月加入58同城,一直从事智能客服算法研发工作,本硕毕业于哈尔滨工业大学,2017年7月毕业后校招加入猎豹移动,从事对话算法工作。
演讲题目:招聘平台下的对话机器人技术实践
演讲提纲:微聊和电话是58同城招聘平台上 C 端求职者和 B 端招聘者的关键连接手段,C 会主动给 B 发起微聊,系统也会通过微聊渠道把一些B端职位推送给 C 端用户(称为反向邀约)。我们将对话机器人应用在上述场景,当 B 不在线时和 C 多轮对话,进行人岗匹配和求职意向判断,若 C 高意向,会利用智能双呼能力(即先由机器人智能外呼提醒 B,B 若同意转接 C,机器人自动外呼 C,然后 BC 电话直连)来促成 BC 的电话连接。本次分享将围绕对话机器人技术在招聘平台的应用展开,包括 QABot 自动问答、TaskBot 多轮引导、对话完成后用户求职意向识别等算法,以及智能双呼能力的应用;此外,我们在问答、求职意向识别等场景实验了 ChatGPT 的应用效果,并与线上模型进行了对比。
听众收益:
1. 招聘场景下对话机器人技术体系的构建
2. 对话机器人中各技术模块的实现
3. ChatGPT 技术的相关探索实验
赵骥 货拉拉 算法工程师
个人介绍:多年 LBS 场景搜索推荐经验。
演讲题目:LBS 场景下数据图谱在搜索推荐的应用
演讲提纲:
1. 介绍 LBS 场景下数据图谱
2. 介绍 LBS 数据图谱在搜索应用
3. 介绍 LBS 数据图谱在推荐应用
听众收益:
1. 了解 LBS 数据图谱价值
2. 了解 LBS 场景搜索推荐利用数据图谱优化应用
识别二维码,免费报名,预约本论坛直播
⑤ 知识图谱与AIGC论坛
最近几年 AIGC 技术的发展十分迅猛,特别是近期以大规模预训练语言模型为基础的 ChatGPT 成功出圈,其展现出的强大的“通用智能”引爆了全网热议,也引发了人工智能领域的专家学者以及产业界的深刻思考。而知识图谱作为符号主义人工智能的典型代表,在这次浪潮中能够发挥什么作用?AIGC 的技术突破会给知识图谱的研究与应用带来哪些新的机遇?它们能够擦出什么样的火花呢?本次论坛我们有幸邀请到来自学术界和工业界的4位专家来分享他们的探索和见解,相信一定能为相关领域的广大从业人员带来启发。欢迎大家参与讨论!
出品人:付瑞吉 快手 MMU 知识图谱中心负责人
个人介绍:快手 MMU 知识图谱中心负责人,本硕博毕业于哈工大,中科大博士后,高级工程师。曾担任科大讯飞 AI 研究院副院长,获吴文俊人工智能科技进步奖一等奖。研究方向包括知识图谱、智慧教育等,在 ACL、EMNLP、Coling、IJCAI、TASLP 等国际会议和期刊上发表学术论文多篇,申请(获得)国家发明专利50余项。在科大讯飞期间,曾研发智能评阅技术,在多地中高考、CET 等大规模考试阅卷中应用;主持研发的个性化学习技术应用于讯飞学习机等多款教育产品中。2021 年加入快手,主持研发业界首个亿级别多模态短视频百科体系“快知”。
冯骁骋 哈尔滨工业大学 副教授/博导
个人介绍:冯骁骋,哈尔滨工业大学计算学部社会计算与信息检索研究中心副教授、博导。智能科学与技术系副主任。研究兴趣包括自然语言处理、文本生成、机器翻译等。在ACL、AAAI、IJCAI、TKDE、Chinese Science等CCF A/B类国际会议及期刊发表论文30余篇。据Google学术统计,论文引用数量超过2800次,一篇论文入选Paper Digest EMNLP 2020 Top Ten 高引论文。担任NIPS、ICML、AAAI、IJCAI、ACL等国际会议程序委员会高级/普通成员;中国中文信息学会自然语言生成与智能写作专委会副秘书长、中国计算机协会哈尔滨YOCSEF副主席等。与华为、腾讯、科大讯飞、微软等国际一流互联网公司保持长期科研合作关系。
演讲题目:面向结构化数据的文本生成技术研究
演讲提纲:近年来,随着深度学习方法的快速发展,文本生成技术也由科学研究走向了实际应用。目前,文本生成任务形式相对多样,包括:自动文摘、对话生成、风格迁移、结构化数据描述生成和多模态数据描述生成等,各个任务之间既存在一些任务驱动的特殊表示和规则也包含相对通用的技术路线和方法。本次讲解将在简要介绍文本生成任务的基础上重点围绕面向结构化数据的文本生成技术进行讲解,包括结构化数据的建模,知识的引入和不同知识的使用方式。期望本次报告对知识驱动的文本生成技术感兴趣的相关听众有所帮助。
李丕绩 南京航空航天大学 教授
个人介绍:李丕绩,南京航空航天大学计算机科学与技术学院/人工智能学院教授,博士生导师,2021年度南京航空航天大学"长空学者"获得者。香港中文大学博士,曾任腾讯AI Lab自然语言处理中心高级研究员。研究方向主要为自然语言处理,包括预训练模型、文本摘要、文本生成和对话系统。曾经在相关领域顶级会议如ACL、EMNLP、SIGIR等发表学术论文60余篇。多次受邀担任ACL、EMNLP、EACL、IJCAI等会议的领域主席。在工业界工作期间负责了多个语言理解、文本生成和智能对话相关重要项目的算法研发和产品发布,有丰富的科研落地实践经验。主持或参与多项国家自然科学基金、CCF-腾讯犀牛鸟基金、CCF-智谱大模型基金等项目。
演讲题目:知识桥接的文本生成算法
演讲提纲:虽然基于神经网络的对话系统已经取得了很大的进步,但是现有模型的成功仍然建立在基于大量训练数据的模式刻画和描述上面,在一些特定的应用场景中表现出知识表达运用和逻辑推理能力较弱的缺点,从而导致模型可解释性差、可控性低、容错能力弱等特点。调研发现,通过向神经网络中融入符号化的知识可以缓解上述这些问题,增强对话生成的质量。所以,我们探索了神经符号计算方式来进一步提升对话系统性能的可行性,具体包括开放文本到符号知识的抽取生成、符号语义表示学习和推理模型、符号推理约束的可控解码等策略。实验也表明所探究思路确实在对话系统和文本生成任务中能取得不错的结果。
李直旭 复旦大学 研究员、博导
个人介绍:李直旭,复旦大学计算机科学技术学院研究员、博士生导师,上海市数据科学重点实验室主任助理,复旦大学知识工场实验室执行副主任,曾兼任科大讯飞苏州研究院副院长,博士毕业于澳大利亚昆士兰大学,主要研究方向为认知智能与知识工程、多模态知识图谱、大数据分析与挖掘等。在领域主流期刊和国际会议上发表论文150余篇,主持十余项国家和省部级科研项目。
演讲题目:AIGC 时代的多模态知识工程思考与展望
演讲提纲:ChatGPT 的火爆出圈使得 AI 生成(AIGC)技术受到了全社会前所未有的广泛关注。此消彼长之下,传统的知识工程遭受了诸多质疑。在多模态智能领域,AIGC 的能力不断提升,多模态知识工程工作应该何去何从?是否仍有价值?在本次分享中,讲者将探讨当前 AIGC 技术耀眼“光芒”背后的“暗面”,思考与展望 AIGC 时代的多模态知识工程研究。
听众收益:
1. AIGC 时代的知识工程是否仍具价值?
2. 多模态知识工程工作应何去何从?
3. 多模态智能的实现路在何方?
王文广 达观数据 副总裁
个人介绍:王文广,达观数据副总裁,高级工程师,人工智能标准编制专家,自然语言处理和知识图谱著名专家,《知识图谱:认知智能理论与实战》作者,专注于AI 大工程、知识图谱、认知智能、自然语言处理、图像与语音分析、大数据和图分析等人工智能方向。现在是上海市人工智能标准化技术委员会委员,上海科委评审专家,中文信息学会(CIPS)语言与知识计算专委会委员,中国计算机学会(CCF)高级会员,中国人工智能学会(CAAI)深度学习专委会委员。曾获得多个国际国家级、省部级、地市级奖项,拥有数十项人工智能领域的国家发明专利和会议、期刊学术论文。在达观数据致力于将自然语言处理、知识图谱、计算机视觉和大数据技术产品化,以OCR、文档智能处理、知识图谱、RPA等产品服务于金融、智能制造、贸易、半导体、汽车工业、航空航天、新能源、双碳等领域。
演讲题目:神经网络大模型 ⊕ 知识图谱 ⊕ 强化学习 = AGI(通用人工智能)
演讲提纲:以人为本AGI :就是以人类为中心的通用人工智能,或者说人工智能是以服务人类为目的的,有名的“机器人三定律”说的也是这个。人工智能发展至今,已经出现了能够将神经网络大模型、知识图谱 、强化学习三者融合的系统(产品),而这已经隐隐散发出一点 AGI 的曙光,或者称之为婴儿期的 AGI。在这个节点往后,类似军备竞赛一样的投入研究和持续发展,曙光终究会成为朝阳,而婴儿也会茁壮成长!本次演讲围绕 神经网络大模型 ⊕ 知识图谱 ⊕ 强化学习 = AGI 方面的观点和思考,与大家一起交流。
听众收益:
1. ChatGPT、Google Bard 等AI 江湖的倚天屠龙记
2. AGI 曙光初现
3. AGI 范式探讨
识别二维码,免费报名,预约本论坛直播
⑥ 最佳行业知识图谱实践论坛
随着互联网的快速发展,数据呈现爆发式的增长,而近几年来以深度学习为主导的人工智能技术在各行各业也展露头脚。知识图谱作为最重要的关键技术之一,在学术界和工业界都得到了高度的重视,并分别构建了自己的知识图谱平台,目前已被广泛应用于很多的领域与场景。知识图谱怎么和行业结合?在行业中哪些问题可以通过知识图谱的技术解决?大规模的图谱在实时的场景中又怎么做到快速的计算?行业中的知识图谱取得什么样的业务效果?本论坛我们有幸邀请到来自企业界的多位资深算法专家,从自己的真实场景,结合业务需要,一步步构建行业图谱,并在下游多个任务上进行验证,从实践的角度分享自己独特的见解。相信能进一步给大家带来启发,逐步推进知识图谱在更多场景和行业开花结果,期待能和大家一起参与讨论。
出品人:孙常龙 达摩院 资深算法专家
个人介绍:孙常龙,现任达摩院-语言技术实验室-应用算法 团队负责人。拥有多篇授权专利,在顶级会议发表论文30余篇,承担国家科技部重点研发项目多项,带领团队在多项的国内外评测比赛中获得第一名,获得2022年世界互联网领先科技成果奖、2022年度高等学校科学研究优秀成果奖(科学技术)科技进步一等奖。研究方向包括机器学习、自然语言理解、文档理解等。在技术赋能业务方面,深入司法、通信、互联网等垂直领域的智能化建设,首创了司法全流程智能化审判系统,该智审模式2022年纳入社科院《法制蓝皮书》,已经落地多家法院。
孙佩霞 中国电信研究院 智行云网大脑技术负责人
个人介绍:主要负责网络运营知识图谱建设,图谱检索,推荐,对话机器人,网络运营大模型相关技术架构。参与过IEEE P2807知识图谱国际标准撰写。国家知识图谱标准撰写,AIIA大模型,智能决策标准撰写。
演讲题目:电信网络运营事件知识图谱构建
演讲提纲:介绍电信网络运维领域事件知识图谱构建,知识图谱检索推荐,知识交互等应用。主要内容包括:
1. 电信网络运营场景介绍
2. 网络运营知识图谱构建
3. 网络知识图谱业务应用
4. 展望
听众收益:
1. 通过网络运营事件知识图谱刻画运维全周期,提升运维效率,并实现知识结构化沉淀。
2. 探索网络场景和知识图谱进一步结合使用,提升网络自智水平。
赵登 蚂蚁集团 算法专家
个人介绍:博士,负责蚂蚁集团知识图谱平台算法能力建设和业务支持。
演讲题目:金融知识图谱的推理与应用
演讲提纲:知识图谱作为一种新的数据管理模式越来越受到行业的重视,它通过图结构与知识语义对客观世界进行建模,定义实体之间的语义关联,提供辅助的推理和决策,与金融、公安等领域的结合创造了巨大的市场空间。过去几年,蚂蚁知识图谱平台结合金融多元业务场景构建领域知识图谱,围绕控风险、促增长核心命题持续和业务深度合作,在这个过程中也沉淀了支撑多业务领域的企业级知识图谱架构和算法推理工具。主要内容包括:
1. 介绍知识图谱的业界发展趋势;
2. 介绍蚂蚁知识图谱的核心能力;
3. 介绍蚂蚁金融知识图谱在各个场景中的应;
4. 对蚂蚁知识图谱未来发展的展望。
听众收益:
1. 了解金融知识图谱的特点和核心能力
2. 了解金融知识图谱如何在各领域发挥应用价值
王俊 吾道科技(iWUDAO)联合创始人、首席科学家
个人介绍:王俊博士,吾道科技联合创始人和首席科学家,曾任富士通美国研究院高级研究员,主要研究领域为NLP和XAI。已获国际专利授权26项,并在包括IJCAI/AAAI/NeurIPS/CIKM/ECAI在内等会议和期刊发表学术论文30篇,同时长期担任ICML/NeurIPS/ICLR/ACL/KDD等会议审稿人。
演讲题目:LLM 时代的金融知识图谱实践
演讲提纲:介绍大语言模型 (LLM) 带来的自然语言处理的范式变化对金融领域产生的影响以及 LLM 在金融领域的落地的场景,探讨如何借助 LLM 来进行金融专业知识图谱构建。
听众收益:
1. 了解 LLM 的能力和不足
2. 判断适合 LLM 的落地场景
3. 金融领域知识图谱构建的参考案例
张文 达摩院 技术专家
硕士毕业于西安电子科技大学。毕业至今一直就职于阿里巴巴,曾在数据产品事业部从事大数据OLAP相关研发,2019年至今在达摩院负责知识图谱相关工程侧研发,支持达摩院多个业务中的知识图谱业务,包括企业图谱、司法图谱、教育图谱、医疗图谱等。
演讲题目:基于知识图谱的召回引擎在行业中的应用实践
演讲提纲:很多业务场景需要相似召回,例如基于企业历史投标召回相似标书,司法图谱中对于当前案件召回相似案件,除了基于纯文本的相似召回,我们提出了一种基于图结构的相似召回,其中包含了基于图游走规则的相似、以及基于图表示的相似,在业务中均取得了显著的效果。进一步将两种图召回策略抽象出统一的图召回引擎,使得业务可以同时使用两种图召回策略,并且按照指定规则混合结果。本次分享的主要内容包括:
1. 业务背景
2. 基于图游走的召回
3. 基于图表示的召回
4. 知识图谱召回引擎
5. 未来展望
听众收益:
1. 基于知识图谱的召回与纯文本的召回有何差异
2. 如何将图结构低成本的运用到业务中
3. 基于知识图谱的召回,如何处理全量和增量数据
宋凯嵩 达摩院 算法专家
个人介绍:东北大学计算机软件与理论专业博士,18年加入阿里巴巴达摩院(杭州)科技有限公司,从事情感分析、内容审核、知识图谱等相关技术的研究和产品研发。独立或合作在 AAAI、IJCAI、SIGIR、WWW、TKDE 等顶级学术会议和期刊发表论文30余篇。
演讲题目:企业知识图谱的构建及业务应用
演讲提纲:通过整合企业及企业关联信息,挖掘海量互联网数据,运用智能分析算法,构建企业知识图谱,全方位洞悉企业信息,帮助企业在风险控制、企业营销、市场监测等领域打造智能企业级应用。
听众收益:
1. 企业图谱的特点?
2. 如何构建企业图谱?
3. 如何把企业图谱应用在下游业务?
赵新颜 达摩院 高级算法工程师
个人介绍:阿里巴巴达摩院高级算法工程师,博士毕业于中国科学技术大学,研究方向为知识图谱,自然语言生成,对话系统,在CCF A类会议,SCI 1区期刊发表相关论文多篇。
演讲题目:知识图谱在法律领域的研究与实践
演讲提纲:法律知识图谱是指一个包含海量法律相关实体和关系的结构化知识库,可以建模不同案件之间、当事人之间深层次的关联关系。本报告将探讨如何利用自然语言处理技术对海量裁判文书进行处理和分析,将分析结果转化为图谱中的实体和关系,构建起法律知识图谱;并阐述并图游走算法和图表示算法其在类案推荐、律师推荐、知识推理等具体场景中的应用方式。同时,报告将介绍图谱存储和可视化交互的相关工具。
听众收益:
1. 法律图谱的特点;
2. 如何构建法律图谱;
3. 图游走和图表示算法的研究与应用
识别二维码,免费报名,预约本论坛直播
▌关于我们
DataFun:专注于大数据、人工智能技术应用的分享与交流。发起于2017年,在北京、上海、深圳、杭州等城市举办超过100+线下和100+线上沙龙、论坛及峰会,已邀请超过2000位专家和学者参与分享。其公众号 DataFunTalk 累计生产原创文章900+,百万+阅读,16万+精准粉丝。
原文链接:https://blog.csdn.net/Datawhale/article/details/129577441?ops_request_misc=%257B%2522request%255Fid%2522%253A%2522170018760516800213048003%2522%252C%2522scm%2522%253A%252220140713.130102334.pc%255Fblog.%2522%257D&request_id=170018760516800213048003&biz_id=0&utm_medium=distribute.pc_search_result.none-task-blog-2~blog~first_rank_ecpm_v1~times_rank-12-129577441-null-null.nonecase&utm_term=AI%E6%B3%95%E5%BE%8B%E5%92%A8%E8%AF%A2