机器学习高质量数据集大合辑

2023/1/3 来源:不详

白癜风治疗专业的医院 https://wapyyk.39.net/bj/zhuanke/89ac7.html

大数据文摘出品

编译:蒋宝尚

在机器学习中,寻找数据集也是非常重要的一步。质量高或者相关性高的数据集对模型的训练是非常有帮助的。

那么用于机器学习的开放数据集有哪些呢?文摘菌给大家推荐一份高质量的数据集,这些数据集或者涵盖范围广泛(比如Kaggle),或者非常细化(比如自动驾驶汽车的数据)。

首先,在搜索数据集时,在卡内基·梅隆大学有以下说法:

数据集不应混乱,因为你不希望花费大量时间清理数据。数据集不应该有太多行或列,因此很容易使用。数据越干净越好——清洗大型数据集相当耗时。数据可以解答一些有趣的问题。

数据集查找器

Kaggle:Kaggle是由联合创始人、首席执行官安东尼·高德布卢姆(AnthonyGoldbloom)年在墨尔本创立的,主要为开发商和数据科学家提供举办机器学习竞赛、托管数据库、编写和分享代码的平台。该平台已经吸引了80万名数据科学家的

转载请注明:
http://www.3g-city.net/gjyby/3006.html
  • 上一篇文章:

  • 下一篇文章: 没有了
  • 网站首页 版权信息 发布优势 合作伙伴 隐私保护 服务条款 网站地图 网站简介

    温馨提示:本站信息不能作为诊断和医疗依据
    版权所有2014-2024 冀ICP备19027023号-6
    今天是: