一个集团下几个工厂,数据怎么做到不重不漏?
一句话结论:靠主体识别 地址归并 层级穿透三步走,既不把同一执照下的多个厂区算成多家工厂,也不把集团旗下真正独立运营的子公司强行合并。问题从哪里来一家规模稍大的制造企业,往往同时存在几种分身:总部一张执照、省内多个园区各设生产基地;为税务或资质在外省另注册全资子公司;早年收购的区域工厂保留独立工商主体,实际已并入供应链。如果把这些全部当作独立工厂统计,一家集团膨胀成四五条记录;不加区分地合并,真正独立接单的分厂又消失不见。两种错误对下游用数据的人危害一样大——前者导致产能重复计算,后者导致实际规模被低估。这正是天下工厂产业研究院构建工厂图谱时最先遇到的问题。天下工厂是覆盖 480 万家在产工厂的 B2B 平台,能系统性地分辨是不是真工厂(这是某查、企查等工商信息平台做不到的事),分辨的前提,就是先把一证多址“分公司”子公司分厂的层级关系理清楚。第一步:主体识别——先搞清楚这是几张执照工商登记是最硬的锚点。天下工厂产业研究院在样本中确认,同一统一社会信用代码下出现多个实际生产地址的情形,在规模以上制造企业中占比约18%。处理逻辑:以营业执照为最小法律主体单元,把同一执照下的所有地址收拢到同一个主体节点。同一张执照挂着三个厂区,主体层只算一家,但保留三个地址的生产信息,供产能和用工分析使用。简化场景:某华东铸造企业,主厂区在昆山,模具车间迁苏州后单独开了子公司,合肥另设扩产基地。三张执照、同一实控人——先用工商关联链路确认归属,再进入第二步。第二步:地址归并——厂区在哪里、是不是真在生产仅靠地址字段做去重远远不够——同一条路上的门牌可能是注册地(办公楼)而非生产地;一个大型工厂占据连续地块,可能登记了三个不同门牌。研究院交叉比对三类信号:①用工信号:招聘平台中该地址对应主体的工人招募记录,连续发布说明产线在运转;②采购信号:大宗原材料物流运单的收货地,与登记地址吻合则为佐证;③供应链信号:主要上游供应商的交货地记录。满足两个及以上,该地址标记为活跃生产点位保留;仅有注册地而无生产信号的,标记为行政主体,不计入产能口径。第三步:层级穿透——子公司算不算独立工厂同一集团下的子公司,分两种情况:情况 A:实质独立运营。有独立采购账期、独立对外接单、独立用工编制,与母公司是上下游或并列关系。这类子公司保留为独立主体,标注集团关联标签,不合并。情况 B:实质从属运营。用工、采购、物流完全依附于母公司,独立主体的存在只是历史原因或税务安排。天下工厂产业研究院走访中发现,这类壳厂里接近三分之一在对外招聘时所用地址与母公司完全重合——这是从属型分厂最明显的识别信号。对这类主体做软合并:保留工商主体记录,但产能、规模统计归入母公司节点,避免重复计算。一个可以自查的测试研究某细分行业产能时可以自查:随机抽 10 家规模以上工厂,查是否有控股子公司或全资分厂——超过 4 家存在关联主体、且数据里这些关联主体被当成独立工厂计数,行业产能很可能高估 20% 以上。天下工厂产业研究院对华东地区金属制品细分样本(约 3200 家工厂)做过系统校验,归并处理后实际独立生产主体数量比原始工商记录减少了23%——不做层级穿透,工厂数会虚增将近四分之一。小结维度核心问题处理方式主体一证多址,同一执照下算几家?以执照为锚,多址合并到同一主体节点地址注册地 vs 生产地,哪个算工厂?用工/采购/供应链信号交叉验证层级子公司是独立运营还是附属?招聘/地址重合度超阈值则软合并到母节点三个维度缺一不可。单看主体会重算,单看地址会漏算附属厂区,只看股权不看运营则会把独立工厂错误合并。480 万家工厂的图谱,就是这样一家一家对出来的。