产业图谱构建:产业链相关企业挖掘

项目背景

为识别产业链中的核心企业和高增长环节,发现投资机会,需要挖掘产业链各环节的相关公司。

技术架构

数据侧

  • 企业基本面(业务、国标行业)

  • 企业技术专利

  • 行业特征

技术流程

关键技术步骤

  1. 企业初步筛选(行业Know-How)

  2. 企业基本面信息获取

    1. 企业照面信息获取(源:天眼查、企查查、爱企查等)

    2. 企业业务/产品/战略信息获取(企业官网、官方社交媒体账号)

    3. 企业项目(历史招投标文件)

    4. 企业核心团队

  3. 标签抽取(产品、产业、技术、行业)

  4. 企业挂链

    1. 多路召回(关键词匹配、相关性匹配、大模型推理、标签匹配)

    2. 结果汇总(投票、加权、集合交并)

挑战

  1. 数据完整性、准确性难以保证

    潜在因素:成本原因、技术原因(爬虫与反爬虫、可行性)、数据源质量问题

  2. 挂链结果可能难以定量评价

    潜在因素:结果评判标准难定,需根据业务方确定,但业务可能随时变,业务人员的评价标准也可能不固定。

  3. 数据时效性

    企业主营业务可能会变,也可能拓展新业务,需要跟踪最新媒体/资讯动态才能捕获变化。

  4. 如何定义和组织行业特征。

    潜在因素:主营业务、供应商客户关系、服务能力(有技术储备,但可能暂时没有业务)

技术流程图

由业务专家定义行业特征,从技术匹配度、业务匹配度、综合匹配度等角度分析企业与行业特征的符合程度。

技术流程图

拓展阅读

CoolCats
CoolCats
理学学士

我的研究兴趣是时空数据分析、知识图谱、自然语言处理与服务端开发