你知道吗?
-
80%
的研究人员时间都花在执行分析前的数据准备工作上 [9、10]
-
36%
是到 2025 年医疗保健行业数据的复合年增长率预测值 [8]
-
2020
年是芯片持续短缺开始的一年 [13]
不断增加的挑战和机遇
大数据领域并非毫无挑战,其中之一便是存储大数据所带来的负担。更重要的是,大数据在数量和复杂性两方面通常都有所增加,而且还在不断变化。
接下来的挑战便是整理、构建和实际分析大数据,此时人工智能 (AI) 可能是一个不可或缺的工具。然而,大数据领域的最大挑战在于获取数据。为了开展分析并提出可行见解,您首先需要获取高质量的数据。
大数据与我们的一切行动都息息相关,可支持我们在医药健康、生命科学和电子科技行业的研发工作。另外,我们还可将大数据用于确保化工产品是纯净的 [4],以及打造智能供应链,以便患者随时随地获得相应药物 [5]。
但我们也着眼于外界,希望帮助他人解锁大数据的可能性。除了参与由非营利CEO癌症圆桌会议推出的 Project Data Sphere 计划,我们还引领了全球肿瘤学数据联盟。这是一项持续性计划,可让全球研究人员获取海量肿瘤学数据 [6, 7].。
最近,我们还与软件开发公司 Palantir 签订了两项合作协议,致力于在多个行业中支持数据驱动决策。作为子公司,Syntropy™ 和 Athinia™ 将 Palantir Foundry 平台的数据集成和分析能力与我们在医药健康和半导体行业的深厚专业知识充分结合在一起。通过这些合作关系,我们正在努力克服大数据合作中的常见障碍和特有障碍,以便为这些行业带来更好的转变。
通过 syntropy™ 处理健康数据
在促进对疾病的认识和治疗方面,医疗保健数据是一项至关重要的资源,而且从不匮乏。从检测结果到 X 射线再到实验室研究和临床试验,每天都会创建大量数据。
据估计,到 2025 年,医疗保健行业数据的复合年增长率将达到 36% [8]。有如此多的工作量既是一个机遇,也是一项挑战。平均而言,数据科学家会花费 80% 的时间来为分析简单地准备数据,而实际分析数据的时间只有 20% [9, 10].。
原因在于,不同的数据来源通常存在于多个独立系统或“数据孤岛”中。举个简单的例子,医疗记录和诊断结果分别存放在不同位置。要从不同位置集成不同格式的数据以创建一个可用数据集,这一过程极其耗时,可能会花费数周到数月时间。通过 Syntropy™,这项工作在很短时间内便可完成。
Syntropy™ 可在这些数据孤岛顶部形成新的外层,将各个数据源合并起来,从而在一个用户友好型系统中创建可供分析的结构化资产。该平台会实时运行,而不是及时生成快照。数据一直都在更新,而且还可随时集成新的数据源。
Syntropy™ 可帮助临床医生和研究人员节约准备数据的时间,从而将时间花在询问大数据相关问题方面。统一的平台还有另一个优势,即播下合作的种子。
即使在单一的临床护理中心或研究机构内,个人、团队和部门也会遇到阻止他们相互合作的障碍。安全性、合规性和兼容性问题都会阻碍合作。数据集可能内含敏感信息。研究人员可能会担心其数据将如何使用及其工作能否得到认可,这对表彰和拨款都很重要。
Syntropy™ 不会剥夺数据的所有权。相反,始发者将享有完全控制权。数据集创建者可让合作者仅访问数据集的某些方面,并指定数据集的使用方式。无论在这些数据上采用什么分析形式,数据创建者都将始终保持与数据的联系,而且还可因在平台上所做的贡献而获得认可。
Syntropy™ 提供了基于现有法律和合同基础的安全环境,以推动涵盖从学术机构到医院再到制药公司等各个环节的整个医疗保健行业积极合作,共同释放大数据的潜力。
平台合作伙伴已经包括多家领先的美国癌症中心 [11, 12],;通过使数据更易于处理以及创造合作空间,Syntropy™ 一直在加快研究进度。这一势头有助于更快取得突破,最终推进新治疗方法的发展以改善人类生活质量。
Athinia™:具备发现隐藏机会的天赋
医药健康和半导体行业可能看起来有着天壤之别,但二者都尚未充分发掘大数据的潜力。这两大领域的共同之处在于,都有机会利用大数据来开辟新的发展道路。
半导体制造极其精细,可能会耗费数月时间,涉及数千个步骤。化学反应复杂,加工工艺精密,任何轻微的杂质或中途的校准误差都会导致失败。
我们对于半导体的期望也在不断提高。体积更小、速度更快、效率更高的微芯片不只是我们的期望,更是技术进步的必备条件。其结果是,制造业也变得愈加复杂。
相比之下,数据标准仍显得过于简单。关于哪些参数可能会影响最终产品的质量和性能,行业认证仅触及了一点皮毛。试错开发和质量偏差仍然很常见。
制造商需要高品质材料,并且还会生成数据来监控和改进工艺。但一家公司可能要耗费长达十年的时间,才能收集到足够的数据,进而开始明白可在哪些方面做出改进。
但半导体行业非但不阻止,反而造成了数据爆炸。这便让 Athinia™ 有了用武之地,可帮助企业利用大数据和 AI 分析来揭示之前隐藏起来的制造流程优化机会。
在通过规范化和编码创建全新数据标准的过程中,Athinia™ 实现了顺畅而安全的数据共享,不受捕捉数据的系统限制。在竞争如此激烈的行业中,数据共享可能看起来有风险。然而,Athinia™ 允许企业对可用数据设置严格的访问权限,并对数据使用情况享有完全可见性和控制权。
因此,各企业可在安全的环境中保护其知识产权,进而积极创造合作机会。我们的愿景是构建一个生态系统,让材料供应商、设备制造商和其他生态系统的利益相关者在大数据方面开展合作,以此推动变革。
在供应商和设备制造商之间形成持续的反馈环路,并且使用 AI 和机器学习进行分析,可让双方更加主动地识别最重要的参数,同时提前加以预防,避免出现质量偏差。这种预测能力为整个行业内更加融洽和透明的合作关系奠定了基础。
Athinia™ 平台可彻底改变半导体制造效率,而这又引发了许多连锁效应。也就是说,测试和优化阶段更少,上市时间加快,同时生产故障造成的浪费有所减少。这不仅有助于实现可持续发展,而且知识共享可加快研发进度和技术创新。
自 2020 年起芯片开始持续短缺 [13],致使制造商承受的压力达到峰值,因此对高效率的呼声从未如此强烈,而 Athinia™ 能让制造商的效率得以提高。
按照道德准则处理敏感数据
对于许多科技公司而言,数据已然成为一种货币。屡次登上头条的数据泄露事件造成了有关数据处理的不信任氛围。无论是在使用患者数据时无视患者同意书,还是未能保护公司的知识产权,各类企业如今都需要在经过深思熟虑后负责任地行事。
我们通过 Syntropy™ 和 Athinia™ 采取了不同的方法,这二者都旨在提供最高级别的安全性并激发好奇心,而又不会剥夺数据创造者的所有权。
但我们还必须确保以负责任的方式使用数据。这首先要采用强大的匿名化工具,使两个平台同时获益。如此一来,患者和商业敏感数据便可得以保密。
我们还在 2021 年成立了数字道德咨询小组,以期引领合乎道德的数字化转型 [14]。该委员会由独立专家组成,他们可帮助我们解答在大数据、AI 和其他新技术方面最紧迫的道德问题。
数字道德准则也由此得以迅速发展,建立了一套可用于处理此类道德问题的可行性标准 [15]。只有建立高度重视负责任数据使用行为和大数据保护的严格框架,各行各业才会意识到大数据的真正力量。通过这种方式,我们便能负责任地开展合作,并在整个行业内引发变革。变革的具体内容可能是加快半导体行业的创新,以满足消费者及 AI 和自动驾驶汽车等领域的需求;或者是通过加快对危及生命的疾病的研究,来提升患者护理质量。
我们的承诺
2012 年,联合国制定了 17 个可持续发展目标 (SDG),以应对全球面临的环境、政治和经济方面的迫切挑战。3 年后,所有成员国都采纳了这些目标。
我们承诺,我们的工作将有助于实现这些宏伟的目标。我们旗下两家合资企业的经营活动符合“目标 9 — 产业、创新和基础设施;目标 9.5 — 加强科学研究”,以及“目标 12 — 负责任的消费和生产;目标 12.6 — 鼓励企业采用可持续发展实践”。凭借促进大数据合作的平台,我们将加快医疗保健研究,并提高半导体制造业的效率和可持续性。
数据来源
其他资源:
Athinia.com
Syntropy.com
projectdatasphere.org
palantir.com
[1] https://www.globenewswire.com/news-release/2022/05/03/2434412/0/en/Big-Data-Analytics-Market-in-the-Energy-Sector-Growth-Trends-COVID-19-Impact-and-Forecasts-2022-2027.html
[2] https://www.smartdatacollective.com/big-data-analytics-has-potential-to-massively-disrupt-stock-market/
[3] https://link.springer.com/article/10.1007/s42979-021-00923-y
[4] https://www.merckgroup.com/en/the-future-transformation/smart-factory.html
[5] https://www.merckgroup.com/en/research/science-space/envisioning-tomorrow/precision-medicine/ai-in-supply-chain.html
[6] https://www.merckgroup.com/en/news/gobda-mou-signing-2017-09-11.html
[7] https://www.merckgroup.com/en/expertise/vibrant-thoughts/world-cancer-day-2021.html
[8] https://www.rbccm.com/en/gib/healthcare/episode/the_healthcare_data_explosion
[9] https://www.forbes.com/sites/gilpress/2016/03/23/data-preparation-most-time-consuming-least-enjoyable-data-science-task-survey-says/
[10] https://www.inzata.com/is-ai-changing-the-80-20-rule-of-data-science/
[11] https://www.Syntropy™.com/news/Syntropy™-md-anderson-news-release-04-29-2021/
[12] https://www.Syntropy™.com/news/Syntropy™-uci-news-release-10-06-2021/
[13] https://en.wikipedia.org/wiki/2020%E2%80%93present_global_chip_shortage
[14] https://www.merckgroup.com/en/news/digital-ethics-advisory-panel-08-01-2021.html
[15] https://www.merckgroup.com/en/sustainability/business-ethics/advisors-for-bio-and-digital-ethical-issues.html