首页 文章
  • 1 votes
     answers
     views

    如何将Dask数据帧作为输入传递给dask-ml模型?

    通常的ML管道涉及将pandas或dask数据帧处理成可以传递到ML模型的形式 . 但是,许多dask-ml模型不能接受Dask数据帧,因为它们不跟踪每个分区的行数 . 调用 fit 方法会抛出 Cannot fit on dask.dataframe due to unknown partition lengths error . 我该怎么办才能将Dask数据帧传递给dask-ml模型? 这是...
  • 0 votes
     answers
     views

    将标签编码值分配给dask数据帧中的列时出错

    我在标签编码功能方面遇到错误 . 为了生成我的案例(最初,我已经在dask数据框中导入了一个csv文件,并且在清理后,它留下了28列),我创建了如下的dask数据框: import dask import dask.dataframe as dd from dask_ml.preprocessing import LabelEncoder country = np.random.choice([...
  • 1 votes
     answers
     views

    在dask-ml中相当于scikit-learn的GroupShuffleSplit?

    我喜欢以一种没有人在测试和训练数据集中出现观察结果的方式进行分裂 . 要在scikit-learn中进行这种分裂,我会做这样的事情,使用GroupShuffleSplit: import numpy as np from sklearn.model_selection import GroupShuffleSplit X = np.array([0.1, 0.2, 2.2, 2.4, 2.3, ...
  • 0 votes
     answers
     views

    拟合线性回归挂起很长一段时间 - Dask-ML

    我想知道我在这里做错了什么,我找不到任何解释使用Dask ML Build 线性回归的前提条件的文档 . 我有一个名为 Facts 的dask数据帧, def train_model(facts, features_cols, target): """ Train linear regression model from fact table Parameters ...
  • -2 votes
     answers
     views

    Dask deployement Python

    对Dask数据帧实现的一点实际操作非常感谢 . 我想将Python的安装主要用作Dask开发环境中的任务 . 我的主要问题是,在单个节点中为机器学习任务最好地部署Dask?你的推荐纯python如(ipython)或jupyter或虚拟环境或virtualwrapper . 我需要joblib . 基于Linux的系统是否优于并行化或性能而非Windows机器?像virtualbox这样的虚拟化系...

热门问题