我国各级政府非常重视大数据的科研和产业发展。2014年政府工作报告中明确指出要“以创新支撑和引领经济结构优化升级”,并提出“设立新兴产业创业创新平台,在新一代移动通信、集成电路、大数据、先进制造、新能源、新材料等方面赶超先进,引领未来产业发展”。科技部、国家自然科学基金委、国家发改委等单位在2012年底前后也先后启动了各类大数据研究课题,各省市纷纷开展大数据的战略行动。
上海的大数据研究与发展在国内起步较早。上海市科委于2012年开始布局,并组织力量开展大数据三年行动计划的调研和编制工作,2013年7月12日率先发布了《上海推进大数据研究与发展三年行动计划(2013―2015年)》,又称“汇计划”,寓意“汇数据、汇技术、汇人才”和“数据‘汇’聚、百川入‘海’”的文化内涵。
“三年行动计划”围绕“发展数据产业,服务智慧城市”的指导思想,对上海大数据研究与发展做了顶层设计,包括大数据理论研究、关键技术突破、重要产品开发、公共服务平台建设、行业应用、产业模式和模式创新等大数据研究与发展的各个方面。具体目标是:(1)研制一批(若干)具有自主知识产权、达到国际领先水平的大数据硬件装备;(2)开发一批具有产业核心竞争力的大数据软件产品;(3)建设6个以上行业大数据公共服务平台、支持6类以上大数据商业应用系统的研制;(4)培养和引进千名高端数据人才。
经过两年的推进工作,“汇计划”的布局取得了一定的成果。主要体现在以下5个方面。
(1)研制大数据平台、服务城市民生。针对城市交通、医疗健康、食品安全、公共安全等大型城市中的重大民生问题,逐步布局研制6个大数据公共服务平台,惠及民生。申康医院发展中心牵头建设的医疗大数据平台实现了3000多万份电子诊疗档案海量数据的高效存储和访问,能够支撑1000名医生同时检索患者电子诊疗档案,支撑用药智能提醒、药物利用分析、疾病影响因素分析、医院绩效管理等应用;交通大数据示范平台积累了120TB城市交通的数据(不包括视频数据),实现了手机数据、气象数据、人口分布数据等相关数据的汇聚融合,成功用于交通拥堵成因分析、交通状况指数编制、实时交通流量分析、重大活动交通预案编制等。
(2)研究关键技术、开发核心产品。“汇计划”布局了大数据基础理论和技术研究。复旦大学、交通大学、上海大学取得了积极进展,设计了包括大数据聚类、压缩、多级缓存等一批新型大数据挖掘算法。博康智能网络科技股份有限公司通过研究大规模横向可扩展分布式高效能的软硬一体化并行架构,稳步推进大数据一体机研制,将为城市公共安全提供保障。云人科技的yuntable实时数据库,星环科技的Transwarp Data Hub内存计算平台在国内独树一帜,均获得了数百万美元的投资。经纬投资的七牛云存储在两年内发展了2500万在线用户。
(3)重视基础研究、强调人才先行。重视开展基础理论和前瞻性研究,强调“技术发展、人才先行”,在国内率先开展数据科学研究和人才培养,布局了“数据科学基础理论与学科体系研究”等一批大数据基础研究项目,数据科学研究生培养计划、大数据工程师培训计划已经在复旦大学等大学启动。筹建“上海市数据科学重点实验室”,联合国内外研究力量,开展数据方面的基础理论和前瞻性研究。该实验室已经创办了“国际数据科学学术会议”、“超学科论坛”,协办“中国科学数据大会”,活跃了大数据的学术气氛,联合了一大批科学家队伍,开展基础理论和前瞻性研究。此外,上海还积极承接国家自然科学基金、科技部、发改委的大数据研究与应用的课题。
(4)抓住数据资源、探索新兴产业模式。大数据的重点是数据资源开发利用。上海多年信息化建设形成了国内最丰富的数据资源,这是上海大数据的优势。“汇计划”从数据积累丰富、数据质量较好、数据可用性高、应用需求迫切的政府公共领域,逐步布局建设大数据公共服务平台,同时支持市场化的各类大数据应用,探索大数据开发利用所形成的新模式、新方法、新业态。例如,医疗数据共享新模式、互联网广告新方法、互联网金融新业态等。上海新分众广告传播有限公司的“媒体投放策略分析决策智能平台”、好耶信息技术(上海)有限公司的“好耶大数据智能营销平台”、超传信息技术(上海)有限公司的“面向互联网行业的亿级用户智能营销系统”等一批支持新模式、新方法、新业态的大数据系统开发使用。
(5)创新推进机制,营造产业生态。为确保行动计划的实施,上海成立了大数据三年行动计划推进办公室,负责行动计划的日常推进工作。着力营造大数据创新生态,成立了“上海大数据产业技术创新战略联盟”。截至2014年9月,“上海大数据联盟”共有85家成员单位,既有从事各类数据应用与服务的企业,也有行业协会和专业学会、高校和研究院所、大数据技术和产品装备研发企业,更有大数据领域投资机构、产业园区、非IT领域的数据资源拥有单位,显现出强大的吸引力,勾勒出上海数据产业的良好生态。
在推进大数据研究与发展过程中,有一些问题需要重视,主要包括三个方面。一是数据共享问题,需要解决数据共享的技术问题、数据拥有者权益保障问题、数据公开制度、规范和技术手段等。二是商业模式和服务模式创新问题,需要提出新型的大数据商业模式、服务应用,扶持新兴数据产业企业,帮助传统企业转型发展,提升企业的核心竞争力。三是数据安全与隐私保护问题,采用技术手段和法律手段,保障数据资源既能充分利用,又不会被滥用,不会泄露个人隐私和国家机密。
大数据对科学研究、经济建设、社会发展和文化生活等各个领域正在产生革命性的影响。上海希望通过“汇计划”的实施,让老百姓享受到个性化的医疗服务、更便利的出行、更放心的食品,互联网、金融等领域创造新型商业模式,让老百姓享受到科技带来的美好生活,促进经济结构调整和产业转型。