构建“1+N”模式
打造大数据信息“中央厨房”
◎文/ 光明网
光明网充分发挥媒体平台的资源链接优势,立足本单位特色, 统筹构建“1个中枢+N方资源”模式,探索破解人才稀缺、数据壁垒、技术门槛等难题,打造大数据信息“中央厨房”,着力当好参谋助手。
汇集专家“外脑”
大数据信息工作门槛高、人才培养周期长,单个单位力量比较有限,从“单兵作战”向“广泛团结”转变是推进工作的首要思路。
“三加强”实现优势互补。 我们充分发挥信息直报点优势,深入研究中央关注议题、关切重点、报送要求等,努力和专家“外脑”优势互补、内外联动。一是加强选题策划,提升工作预见性。对涉及大局大势、民情民意、风险隐患、趋势动向等适合用大数据分析的选题反复打磨、找准切口;通过每日选题会、每周选题策划、每月重点策划等方式提升团队成员的选题意识和敏锐度。二是加强规律研究,探索场景适用性。大数据分析适用于时间跨度较大、参与群体较多的场景,与信息工作相结合时,应把握好深度研究和报送时效、数据分析维度和社会治理需求、数据可获取和数据可解释等的关系。为此,我们围绕大数据选题方向、分析维度、写作方式等定期
总结研究,努力提升对大数据信息工作的规律性认识和把握。三是加强统筹协作,增强内外配合度。用好外部资源的前提是内部“懂行”。我们通过内部领域分工,推动编辑深耕细分领域,对行业基本知识、公开数据来源、相关领域的历史数据等加强积累,与外部资源积极联系、加强协作,努力推动合作成果转化为资政参考。
“三注重”挖掘智库资源。我们充分发挥媒体平台联系专家学者、智库机构作用,构建“大信息”工作格局,集思广益、博采众长。一是注重听取专家意见。邀请政治、外交、意识形态等领域专家,担任相关研究专题的参谋顾问,充分听取意见建议,力求研究成果“语当其时,谏当其用”。二是注重凝聚青年力量。各行业领域的中青年新秀,既有专长领域,又思维活跃,可以带动高校和机构团队参与分析研究,成为重要外部补充力量。三是注重跨界联动。对不同学科背景的专业人员兼收并蓄,既包括在特定知识领域深耕多年的学者,又包括具备数据抓取、统计特长的专家,让跨学科配合碰撞出更多思维火花。
对接企业平台
探索各类数据资源的链接、整合,推动网络舆情分析由单一化向全局化转变,破解“盲人摸
专 题
象”的困境。
拓宽数据来源。用好已搭建并使用多年的光明网舆情大数据监测分析系统,实时采集新闻网站、微博、论坛、博客、电子报、客户端等平台公开信息。横向上,与抖音、快手、B站、小红书、知乎等新兴互联网平台建立联系,以主题调研、专题合作等形式推动数据共享;纵向上,在思想理论、意识形态等特色领域深入挖掘多方数据资源,形成垂直领域数据的跨平台积累。
拓展分析维度。 通过多维度对比、多平台综合等方式深度使用数据,用好大数据关联分析技术,努力在海量信息中把握民意动向,进而找出网络舆情与社会动态之间的深层次关联。将静态数据与动态数据相结合,不仅关注话题信息总量,更关注阶段性的信息变化趋势,找准数据分析的关键节点;将总体数据和特征数据相联系,从话题观点分布、情感属性、人群地域特征等细化维度进行数据交叉分析,真正把握民意诉求;将单一平台数据与全景数据相对比,找到特定主题中各平台数据的共性与特殊性,为舆情传播态势研判提供支撑。
解决合作难点。数据是企业平台的核心资产,与商业秘密密切相关。合作时应找准切入点,突出“契合”,注重“共赢”,主动探索那些与互联网发展新趋势、新特点、新问题相关的选题,力求研究成果对合作企业有所助益,真正调动企业参与的积极性。如,我们调研主流互联网平台的发展特征及生态治理情况,调研内容与企业发展密切相关,因此得到微博、抖音、知乎、B 站、小红书等平台的大力支持,收集到大量有效数据样本,结合自采内容综合分析后形成的分析报告,为有关部门开展舆情分析提供了有益参考。
巧用技术工具
用好大数据分析相关技术工具,在数据清
理、统计、呈现等各环节寻找“技术+”的合适场景,有助于提高大数据信息报送质量。
提高信息精度。技术工具可以帮助我们从庞大、复杂的信息中分辨别有用心的引导和客观真实的民意。比如,数据库可以辅助交叉印证。全网全媒类“大数据”可以提示总体情况和大致趋势,但其中也包含许多无效信息。细分领域下的小数据由于来源经过严格甄别,往往更为精准。我们在日常工作中注重积累,围绕各领域网络活跃人物、各国智库机构等构建多个小数据库,当进行大数据分析时,可以交叉印证、溯源比对,辅助判断“大数据”的准确度,提升结论的准确性。再如,人工智能技术可以帮助去伪存真。互联网数据中,一些“水军”账号通过快速、大规模、集中发帖,刻意引导舆论,制造“伪热度”,导致“数据膨胀”,大大降低了可信度。我们通过智能识别技术,利用相关模型,根据用户属性特征、关系特征、行为特征、内容特征等自动识别“水军”,修正抓取的数据信息。
实现多维呈现。运用可视化工具可以浓缩展示海量信息。将复杂数据转化为清晰简洁的视觉信息,需要做好三步。第一步,读懂数据。数据可视化是数据结论的表现形式,在呈现前需要明确“哪些维度有助于主题表达”“哪些指标能衡量舆论态势”“哪些数据能体现趋势特征”等问题,仔细考量数据的含义和解读方式。第二步,呈现数据。当前可视化工具众多且各具特色,要结合不同数据类型和呈现目标选择不同的表现形式,以达到最好的呈现效果,避免因为图表设计不当导致数据的误读。第三步,让数据说话。饼状图、树状图、直方图等是“用数据说话”的重要手段,要突出主次轻重,通过合理的数据布局、适当的文字标注、直观的属性归类,真正实现“让数据说话”。
(执笔:高 雅)责任编辑/尹 姗
论 坛