数据挖掘:潜优项目挖掘
分析维度
数据指标
财务健康状况
竞争优势(品牌力量、专利技术、转换成本、网络效应)
团队质量(管理层质量、核心团队背景)
市场地位和份额
财务健康度
盈利能力
成长性
财务稳定性
竞争优势评估
基础数据
新闻
社交媒体: 抖音、微信、小红书、微博
研究报告
行业数据(报表)
企业图谱(画像):基本工商信息信息、投资关系、客户供应商关系、技术创新
……
高级指标
- 品牌护城河:是否具有高用户忠诚度,如何通过公有域数据度量品牌护城河
- 成本优势:是否具有规模效应或资源垄断
- 专业/技术壁垒:研发投入占比、专业资质认证
- 团队质量:管理层质量、核心研发团队背景
品牌护城河
品牌溢价能力:高毛利率可以反映品牌对价格的控制率,如果对比同行业其它企业,毛利率显著更高且稳定,则品牌护城河较深。简单情况下,可通过毛利率简单表示品牌溢价:$毛利率=(营业收入-营业成本)/营业收入 \times 100%$
市场占有率(Market Share)
$市场占有率=(\frac{企业销售额}{行业总销售额})\times 100%$
趋势分析:若市场占有率持续高且稳定,说明品牌具有稳固的护城河。
品牌价值:权威机构的品牌价值排名:
品牌大数据指数:
社交媒体声量:基于微博、微信、抖音等平台的搜索量、讨论量、粉丝互动率评估品牌曝光度和用户粘性。
搜索引擎指数
舆情分析:如消费者评价极性分析(正负面评价比例)
消费者忠诚度:复购率、净推荐值(%推荐者-%贬损者)
……
成本优势
如何判断一个企业是否具有可带来成本优势的因素?
是否具有规模效应?
规模效应:随着产量、用户量、市场份额提升,单位成本下降或边际收益递增的现象,本质是成本分摊或效率提升。
成本与产量关系分析:单位成本趋势、边际成本递减
市场类型分析:基础设施型市场、大众消费型市场、新兴领域市场等。
技术与管理因素:技术连续性、管理效率(流程优化、自动化降本增效)
专业/技术壁垒
研发强度:研发投入占比是否在业内具有显著优势。
技术代差:如台积电5nm制程领先竞对。
软件著作权数量和质量
专利数量和质量
如宁德时代在专利布局方面动力电池专利超5000项
客户转换成本(客户更换供应商的预估成本)
……
团队质量
管理层质量
学历
大厂履历
业绩
完整性
核心研发团队背景
技术能力
创新能力
市场地位与份额
$市场份额=\frac{企业销售额}{整个市场销售额}\times 100%$
基于行业报告、政府统计数据或第三方研究机构的数据来获取市场总量。
定性分析
个人社交或专业合作网络信息反馈(客户反馈) 可转换为客户满意度数值指标(源调查问卷)
员工留存率
产品复购率
……
技术
数据采集
- ……
文本挖掘与结构化
实体识别(企业、产品、产业、人物等)
实体匹配与对齐
情感极性分类(针对产品、品牌、人物)
模型:BERT
新闻事件标记(产品发布、技术创新、资金、人员变动、风险、产能)
新闻/政策/企业业务信息标签提取(产业标签、企业名录标签、产品标签)
专利技术标签提取
研报识别(行业头部及潜优公司)
OCR
新闻/政策文本多标签分类
模型:ERNIE
知识图谱
- 企业图谱(舆情、技术、产业、合作关系、人才)