机器学习高质量数据集大合辑
2023/1/3 来源:不详白癜风治疗专业的医院 https://wapyyk.39.net/bj/zhuanke/89ac7.html
大数据文摘出品
编译:蒋宝尚
在机器学习中,寻找数据集也是非常重要的一步。质量高或者相关性高的数据集对模型的训练是非常有帮助的。
那么用于机器学习的开放数据集有哪些呢?文摘菌给大家推荐一份高质量的数据集,这些数据集或者涵盖范围广泛(比如Kaggle),或者非常细化(比如自动驾驶汽车的数据)。
首先,在搜索数据集时,在卡内基·梅隆大学有以下说法:
数据集不应混乱,因为你不希望花费大量时间清理数据。数据集不应该有太多行或列,因此很容易使用。数据越干净越好——清洗大型数据集相当耗时。数据可以解答一些有趣的问题。
数据集查找器
Kaggle:Kaggle是由联合创始人、首席执行官安东尼·高德布卢姆(AnthonyGoldbloom)年在墨尔本创立的,主要为开发商和数据科学家提供举办机器学习竞赛、托管数据库、编写和分享代码的平台。该平台已经吸引了80万名数据科学家的