阅读周讲座二:机器学习与数据科学在生物医学、癌症治疗方面的应用前景

47日上午,美国圣犹达儿童研究医院生物信息研究科学家万时彪博士为北师港浸大师生带来主题为机器学习与数据科学在生物医学、癌症治疗方面的应用前景的嘉宾讲座。


工商管理学部电子商务与资讯系统管理专业课程主任柴俊毅博士致开幕词。



万时彪博士向大家介绍了机器学习工具在处理人类基因测序大数据领域的应用。万博士提到,机器学习的架构分为三种:监督、无监督、及半监督学习。他详细介绍了基因测序领域的研究背景、研究现状及研究方法和对两个研究话题进行了深入介绍和分析。


万博士选取的第一个话题是关于用非监督学习技术选取处理转入组数据,本话题主要针对单细胞。万博士深入介绍了蛋白质转入组、对整体基因表达的研究、SHARP算法及其架构、随机映射和聚类问题如何解决等。这个话题的结论是:1. 非监督学习对于启发型研究非常有用;2.非监督学习很适合用于处理大量高维度数据;3.随机映射可以给PCA降维并保留cell-to-cell distance


万博士选取的第二个话题是关于用监督学习和半监督学习的方法处理蛋白质数据。他深入介绍了如何用机器学习挖掘和处理蛋白质和亚细胞位置,并介绍了两种模型:PseAAPA。这个话题的结论是:1.半监督学习对于处理有限labelled data 很有用;2. 半监督学习可以充分提取annotated dataunannotated data的信息;3, 用ensemble features individual feature 更好;4. PAPseAA是相互补充的。


讲座现场


在问答环节中,线上线下的听众们都踊跃提问,万博士对大家的疑问一一进行解答,与大家就SHARP、聚类分析、新型冠状病毒疫苗等话题进行了深入讨论,现场气氛热烈。


嘉宾介绍

万时彪博士

美国圣犹达儿童研究医院生物信息研究科学家,宾夕法尼亚大学博士后研究员,普林斯顿大学博士后,香港理工大学机器学习、生物信息学博士。