手机大数据相对传统统计数据,具有覆盖范围广、数据稳定性高、分析样本量大、数据连续性强等优势,有助于规划师更为精准的把握城市人口特征。规划设计行业已普遍采用手机大数据进行辅助分析,但在应用时仍存在数据代表性不全面、数据校核与扩样困难、实施成本高等问题。
行业内手机大数据数据源分为两大类别:手机运营商信令数据与移动互联网LBS数据,从用户覆盖度、位置精度、数据汇报均衡性三个方面评估,单一来源数据样本存在一定的缺陷及偏差。
-
用户覆盖度:单一运营商用户有限,手机LBS数据横跨三大运营商,从总用户量角度,手机LBS数据用户高于单一运营商信令数据用户。
-
位置精度:手机LBS数据以GPS数据为主,定位精度高;信令数据为基站定位原理,位置存在200至2000米偏差;手机LBS数据在职住识别及微观应用时,优于手机信令数据。
-
汇报均衡性:手机LBS数据汇报与用户使用手机位置服务有关,与用户空间位置移动无关;手机信令数据汇报机制中,除用户日常使用触发汇报外,空间位置移动LAC之间切换时也会触发汇报,数据汇报均衡性上手机信令数据优于手机LBS数据,特别在出行OD识别方面。
手机信令与LBS任何一种数据在应用时,都需要获取校核与扩样的Y值,但单一数据来源无法准确地扩样与校核。“数据真值”需手机信令数据与LBS数据融合使用,校核、扩样后方可得到高精度、高质量的应用效果。
-
数据获取难:由于手机大数据在用户个人隐私保护方面带来的安全性审核要求,导致行业协调数据周期长,且采购成本高。
-
研发投入大:原始数据处理成结构化数据过程中,需投入大量的底层数据开发人员与软硬件资源。
-
实施周期长:从原始数据清洗至行业指标分析,项目周期至少3个月以上,实施周期较长。
针对以上行业痛点,杭州浙诚数据科技有限公司(简称浙数科技)从满足规划设计行业需求的角度,制定标准化的指标体系,总结近年来大数据分析模型的经验,构建工程化的模型算法,结合实际项目情况实现浙数科技产品化的数据服务,不断降低行业用户的数据使用成本,推动手机大数据的社会生产力。
同时,为了弥补单一数据源的劣势,浙数科技创新性地提出多源异构数据融合服务,即融合行政区划、交通分区、手机信令(500×500米)、手机LBS(GeoHash)等多层级空间颗粒数据,通过数据结构化、指标标准化、模型算法工程化、分析展示产品化等标准化服务,快速响应客户的数据需求,进而满足客户时空多维度指标体系设计,以便支撑宏观、中观、微观业务,有助于客户全面详细地了解城市人口现状特征,打造浙数科技的特色高性价比手机大数据服务。

以重庆市为例:全国第七次人口普查全国总人口数据为14.12亿,2020年底工信部发布的运营商移动用户总数是15.99亿,七普总人口数据与运营商总用户数比值1:1.13;极光LBS计算出重庆居住人口中电信用户占比25.98%,按以上比值反推电信用户占比为29.35%,电信手机信令计算出居住人口933万,扩样后全市居住人口是3178.07万,占全市七普总人口的99.15%。
-
居住人口分析:居住栅格、年龄段、性别、人数;
-
工作人口分析:工作栅格、年龄段、性别、人数;
-
职住关联:居住栅格、工作栅格、人数;
-
24小时人口动态分布:日期、时辰、位置栅格、本地人数、外地人数;
-
外来人口来源地分析:日期、地级市、人数;
-
居住人口市内出行分析:日期、出发时间段、出发栅格、到达栅格、出行目的、出行人次;
-
外来人口市内出行分析:日期、出发时间段、出发栅格、到达栅格、出行目的、出行人次。
注:近期将增加南通、嘉兴、湖州、金华、三亚、咸宁、黄冈、阳江等8个城市数据集
本次产品发布包含了33个城市居住人口分布、工作人口分布、跨区通勤期望线、国家中心城市跨区通勤分布。

http://buding.zhechengdata.com/page/website/index.html

北京市居住人口分布

上海市居住人口分布

天津市居住人口分布

欢迎规划设计行业人员就以上成果进行参考、研究和使用,若浙数科技提供的数据能够为您的工作提供便利,为当地城市的发展提供帮助,我们将感到不甚荣幸,也期望行业专业人士能够对我们的分析研究提供更多的指导和建议。
浙数科技也将在未来不断更新城市数据集,致力于推动标准化手机大数据在行业的深入应用,也欢迎就数据服务向我们进行咨询。

最近有朋友问我们:为什么没有及时看到推文?因为微信改了推送规则,没有点“赞”或“在看”,没有把我们“星标”,都有可能出现这种状况。
加“星标”,不迷路!看完文章顺手点点“赞”或“在看”,就可以准时与我们见面了~
原文始发于微信公众号(城市数据派):33个城市,在线可查!基于手机信令、LBS融合数据集产品发布丨城市数据派