数据挖掘:潜优项目挖掘

分析维度

数据指标

  • 财务健康状况

  • 竞争优势(品牌力量、专利技术、转换成本、网络效应)

  • 团队质量(管理层质量、核心团队背景)

  • 市场地位和份额

财务健康度
  • 盈利能力

  • 成长性

  • 财务稳定性

竞争优势评估
基础数据
  • 新闻

  • 社交媒体: 抖音、微信、小红书、微博

  • 研究报告

  • 行业数据(报表)

  • 企业图谱(画像):基本工商信息信息、投资关系、客户供应商关系、技术创新

  • ……

高级指标
  • 品牌护城河:是否具有高用户忠诚度,如何通过公有域数据度量品牌护城河
  • 成本优势:是否具有规模效应或资源垄断
  • 专业/技术壁垒:研发投入占比、专业资质认证
  • 团队质量:管理层质量、核心研发团队背景
品牌护城河
  • 品牌溢价能力:高毛利率可以反映品牌对价格的控制率,如果对比同行业其它企业,毛利率显著更高且稳定,则品牌护城河较深。简单情况下,可通过毛利率简单表示品牌溢价:$毛利率=(营业收入-营业成本)/营业收入 \times 100%$

  • 市场占有率(Market Share)

    $市场占有率=(\frac{企业销售额}{行业总销售额})\times 100%$

    趋势分析:若市场占有率持续高且稳定,说明品牌具有稳固的护城河。

  • 品牌价值:权威机构的品牌价值排名:

    BrandZ

    凯度中国

  • 品牌大数据指数:

    • 社交媒体声量:基于微博、微信、抖音等平台的搜索量、讨论量、粉丝互动率评估品牌曝光度和用户粘性。

    • 搜索引擎指数

    • 舆情分析:如消费者评价极性分析(正负面评价比例)

  • 消费者忠诚度:复购率、净推荐值(%推荐者-%贬损者)

  • ……

成本优势

如何判断一个企业是否具有可带来成本优势的因素?

是否具有规模效应?

规模效应:随着产量、用户量、市场份额提升,单位成本下降或边际收益递增的现象,本质是成本分摊或效率提升。

  • 成本与产量关系分析:单位成本趋势、边际成本递减

  • 市场类型分析:基础设施型市场、大众消费型市场、新兴领域市场等。

  • 技术与管理因素:技术连续性、管理效率(流程优化、自动化降本增效)

专业/技术壁垒
  • 研发强度:研发投入占比是否在业内具有显著优势。

  • 技术代差:如台积电5nm制程领先竞对。

  • 软件著作权数量和质量

  • 专利数量和质量

    如宁德时代在专利布局方面动力电池专利超5000项

  • 客户转换成本(客户更换供应商的预估成本)

  • ……

团队质量
  • 管理层质量

    • 学历

    • 大厂履历

    • 业绩

    • 完整性

  • 核心研发团队背景

    • 技术能力

    • 创新能力

市场地位与份额

$市场份额=\frac{企业销售额}{整个市场销售额}\times 100%$

基于行业报告、政府统计数据或第三方研究机构的数据来获取市场总量。

定性分析

  • 个人社交或专业合作网络信息反馈(客户反馈) 可转换为客户满意度数值指标(源调查问卷)

  • 员工留存率

  • 产品复购率

  • ……

技术

数据采集

  • ……

文本挖掘与结构化

  • 实体识别(企业、产品、产业、人物等)

  • 实体匹配与对齐

  • 情感极性分类(针对产品、品牌、人物)

    模型:BERT

  • 新闻事件标记(产品发布、技术创新、资金、人员变动、风险、产能)

  • 新闻/政策/企业业务信息标签提取(产业标签、企业名录标签、产品标签)

  • 专利技术标签提取

  • 研报识别(行业头部及潜优公司)

    OCR

  • 新闻/政策文本多标签分类

    模型:ERNIE

知识图谱

  • 企业图谱(舆情、技术、产业、合作关系、人才)
CoolCats
CoolCats
理学学士

我的研究兴趣是时空数据分析、知识图谱、自然语言处理与服务端开发