港大研究转化商用 CISC 网络爬虫分析网络舆情(PCM 电脑广场 20210130)
2021年02月09日
返回新闻港大研究转化商用 CISC 网络爬虫分析网络舆情
PCM 电脑广场 20210130
网民集合的力量,在 Reddit 的 r/WallStreetBets 击退沽空 GameStop 的炒家发挥至极。网民在讨论区和社交网络的讨论影响品牌形象,但商户却无法分析留言。香港大学计算机科学系副教授邹锦沛研究网络爬虫技术多年,透过技术转移处将研究成果转为商用,成立创业公司 CISC ,推出艾慧思( IaaS )服务,企业藉此分析网络舆情。
邹锦沛专问研究网络犯罪和电脑取证,同时身兼港大资讯保安及密码学研究中心主任,早在 2005 年与香港海关研发「网线监察系统」,追踪网上 BitTorrent 发放侵权档案。他解释,该系统通过规则为基础的爬虫技术,自动搜集网上的 BT 种子加以分析是否属侵权内容。当年用此系统所得的证据,拘捕外号「古惑天皇」的陈乃明,成为全球首宗用 BT 上载被控侵权案例。
邹锦沛基於此系统为海关开发更多网上智能情报分析技术,如分析互联网图片和文字,追踪网上售卖假货活动。之后更升级成追踪社交平台的「网讯 」( SocNet System ),打击商户在社交平台销售侵权货品。
他指出,同一技术应用在分析商业品牌大有潜力,於是在 2016 年成立创业公司 CISC ,把该技术转为企业的网络服务艾慧思。
艾慧思加入自然语言处理( NLP )、深度学习影像分析等人工智能技术,分别从 Facebook 、 Instagram 等社交网络,以及网上讨论区搜集公共数据,经分析整理找出内里的智能讯息。邹锦沛表示,所产生的智能讯息可以用於保护知识产权、调查网络罪案,而最广泛用途便是商业智能分析。「通过分析语意,了解评论属正评或负评,有助企业品牌掌握用户的情绪。」
该平台亦可按企业的需要,自动追踪个别议题,当网络舆论转风向,及早作出提示。
然而在研究成果转化的过程充满挑战,邹锦沛获港大技术转移处( TTO )协助,从过去的研究技术变成推出市场的商业服务。他表示,研发技术与商业社会始终有一定差距, TTO 提供支援,了解市场的需求。
他举例,设计用户友善的介面是重要一环。过去为海关所开发的系统,训练专人操作,用户介面设计可以较复杂。惟推出市场的服务由用户自助使用,介面设计要求简单易用,因此聘试专人设计。
由於过去与特区政府多个部门合作, CISC 首批客户都是部门和院校为主,正在开拓更多商业市场。他表示,过去有海关的成功案例,有助加强客户的信心。事实上,艾慧思还在扩展功能,更贴近企业客户追踪品牌的需要,例如爬虫系统加入人工智能,从数据发掘更多资讯。