博士研究人员在处理大数据集时面临的5个挑战-在职工商管理博士研究生_博士招生信息网 
最新报名:
商学院banner图

Business School

商学院

博士招生扫一扫

手机:13521943680   
电话:010-62904558

博士研究人员在处理大数据集时面临的5个挑战
发布时间:2022-01-13 20:51:35

博士研究人员在处理大数据集时面临的5个挑战
大数据给每个科学学科的研究方式带来了前所未有的变化。研究人员的工具仅限于其领域的特殊性,而大数据现在正日益成为跨学科的通用工具。大数据集的可用性以及存储和共享大量数据的能力为研究人员开辟了多种科学探索途径。
作为研究工作的基础,数据对研究人员来说非常有价值。因此,数据泛滥被大多数研究人员视为福音,尤其是那些在遗传学、天文学和粒子物理学领域工作的研究人员。虽然大数据现在被认为是一种无与伦比的科学范式,但统计学家建议研究人员对大数据保持警惕,因为大数据的性质是多维的且不断变化的。研究人员已经接受了大数据,但随着它提供的机会,它也带来了复杂性。院士在处理大数据时面临的一些主要挑战是:


1. 有效管理数据是困难的:存储大量数据给没有机构支持的研究人员带来了基础设施和经济问题。除此之外,管理和共享大型数据集也很复杂,因为数据的隐私、安全和完整性可能会导致涉及国际合作的利益冲突。因此,需要一种可持续的经济模型,以克服基础设施挑战并为数据驱动的研究提供更顺畅的过程。

   
2. 数据收集优先于研究设计:尽管数据对于任何研究都至关重要,但有时,收集数据的重要性高于精心设计的研究。一些研究人员倾向于抱有这样的误解,即更多的数据与更好的研究直接相关。与其关注收集数据的方式和收集数据的目的,不如收集大量数据,并假设它会加强研究。这方面的一个例子是英国的一项研究,该研究涉及 20,000 名儿童,以评估巴氏杀菌牛奶的益处。该 研究设计和 进行试验的规模受到统计学家威廉•戈塞特的批评。他说,由于随机化不充分,只有 6 对双胞胎的研究会更可靠。 


3. 大数据分析需要特殊工具:大量数据无法使用常规数据分析工具进行分析。标准软件技术通常设计用于分析小型数据集。然而,大数据包含如此庞大的数据,以至于传统工具要么需要大量时间来分析它,要么无法处理它。因此,需要特殊的工具将数据连接到模型,以实现对数据的准确评估。这方面的一个例子是 Microsoft 的称为 FaST-LMM(因子谱变换线性混合模型)的算法。 


4. 数据泛滥可能使数据解释变得具有挑战性:大数据包含来自各种来源的数据,使其具有多面性且难以解释。例如,包含有关世界人口信息的数据集将包括基于不同地理位置、生活方式等的数据,并且可以使用不同的技术进行收集。研究人员可能无法考虑数据的所有方面,从而导致错误的结论。因此,需要开发能够克服统计偏差的可靠数据解释程序。     


5. 在数据中寻找模式的倾向是危险的:由于大数据很大,研究人员需要从数据集中分离出有用的数据。然而,在大多数情况下,不是消除不需要的数据,而是倾向于寻找模式,直到数据中的一些证据支持预先设想的想法。在进行研究时,这是一个危险的陷阱。            
不可否认,数据是一种宝贵的资产——2012 年世界经济论坛将数据宣布为一类新的经济资产证实了这一事实——大数据在科学进步中发挥着开创性的作用。然而,处理大量数据的缺点表明,大数据可能并不总是能拼出好的数据。因此,研究人员需要平衡数据与他们的主题专业知识和科学推理,以实现大数据的最佳潜力。

 

上一篇:
下一篇:美英博士后研究人员面临的挑战

版权申明:以上课程知识产权归属办学方 清大紫荆管理博士课程教育中心网仅提供课程信息展示,而非商业行为
在职工商管理博士研究生网仅提供技术支持 http://www.pxemba.com/ 粤ICP备17004821号
Copyrights © 2007-2022 PXEMBA.COM Inc. All rights reserved