数据目录#

当第一次开始进行数据分析时,空白笔记本可能会非常令人望而生畏,特别是如果您从未使用过笔记本或自己创建过笔记本。

Anaconda 提供了样本数据集目录,让您熟悉在笔记本中运行和分析数据集。

访问数据目录#

  1. 要打开 Anaconda Notebooks,请单击 Anaconda Cloud 顶部的 **Notebooks**。

  2. Notebooks 打开后,通过单击左上角的蓝色加号 + 打开新的启动器。

  3. 在启动器中,在 **Anaconda 数据目录** 下,单击 **探索目录**。

探索目录页面提供预先填充的数据集,让您熟悉在笔记本中进行数据分析。

在 Anaconda Notebooks 中使用数据目录#

如果您不熟悉使用笔记本,请打开 Anaconda Notebooks 上的 README.ipynb,了解 Anaconda Notebooks、在笔记本中工作、创建 conda 环境以及常见问题解答。

有几种方法可以运行数据目录中的单元格。

  • 要运行单个单元格,请单击该单元格将其选中,然后按笔记本顶部的播放按钮。

  • 运行单元格的另一种方法是选择它并按 Shift + Enter(在 Mac 上按回车键)。

  • 单击菜单栏中的 **运行** 并从下拉菜单中选择一个选项,可以找到各种运行单元格的方法。

在本地系统上使用数据目录#

要在本地系统而不是 Anaconda Notebooks 中访问数据目录,请完成以下步骤。

  1. 下载 Anaconda(如果您尚未下载)。

    注意

    如果您使用的是 Miniconda,请在执行以下步骤后运行 pip install anaconda-catalogs[examples] 以安装必要的依赖项。

  2. 要安装运行 Anaconda 数据目录所需的软件包,请打开终端(Windows 上的 Anaconda Prompt)并运行以下命令。

    conda install anaconda-cloud::anaconda-catalogs
    
  3. 通过在 Jupyter Notebook 或其他 Python 环境中运行以下命令(以及后续步骤)来导入 Intake

    import intake
    
  4. 要查看可用的示例目录列表,请运行以下命令。

    examples = intake.open_anaconda_catalog("examples")
    list(examples)
    
  5. 选择一个特定目录并查看它包含哪些数据集。

    # Replace <CATALOG> with the catalog name
    cat = examples.<CATALOG>
    list(cat)
    
  6. 要从上一步骤中生成的列表中检索特定数据集中的数据,请运行以下命令。

    # Replace <DATASET> with the dataset name
    df = cat.<DATASET>.read()
    
  7. 要在 Pandas Dataframe 中显示目录的前五个条目,请运行以下命令。

    df.head()