产业图谱构建:产业链相关企业挖掘
项目背景
为识别产业链中的核心企业和高增长环节,发现投资机会,需要挖掘产业链各环节的相关公司。
技术架构
数据侧
企业基本面(业务、国标行业)
企业技术专利
行业特征
技术流程
关键技术步骤
企业初步筛选(行业Know-How)
企业基本面信息获取
企业照面信息获取(源:天眼查、企查查、爱企查等)
企业业务/产品/战略信息获取(企业官网、官方社交媒体账号)
企业项目(历史招投标文件)
企业核心团队
标签抽取(产品、产业、技术、行业)
企业挂链
多路召回(关键词匹配、相关性匹配、大模型推理、标签匹配)
结果汇总(投票、加权、集合交并)
挑战
数据完整性、准确性难以保证
潜在因素:成本原因、技术原因(爬虫与反爬虫、可行性)、数据源质量问题
挂链结果可能难以定量评价
潜在因素:结果评判标准难定,需根据业务方确定,但业务可能随时变,业务人员的评价标准也可能不固定。
数据时效性
企业主营业务可能会变,也可能拓展新业务,需要跟踪最新媒体/资讯动态才能捕获变化。
如何定义和组织行业特征。
潜在因素:主营业务、供应商客户关系、服务能力(有技术储备,但可能暂时没有业务)
技术流程图
由业务专家定义行业特征,从技术匹配度、业务匹配度、综合匹配度等角度分析企业与行业特征的符合程度。