Pandas怎么使用分隔符或正则表达式将字符串拆分为多列(pandas,开发技术)

时间:2024-05-05 07:41:13 作者 : 石家庄SEO 分类 : 开发技术
  • TAG :

    Pandas%E6%80%8E%E4%B9%88%E4%BD%BF%E7%94%A8%E5%88%86%E9%9A%94%E7%AC%A6%E6%88%96%E6%AD%A3%E5%88%99%E8%A1%A8%E8%BE%BE%E5%BC%8F%E5%B0%86%E5%AD%97%E7%AC%A6%E4%B8%B2%E6%8B%86%E5%88%86%E4%B8%BA%E5%A4%9A%E5%88%97

字符串方法是pandas.Series方法。

适用于pandas.Series或pandas.DataFrame列

要按定界符(delimiter)进行拆分,使用字符串方法str.split()。

以以下pandas.Series为例。

将定界符指定为第一个参数。一个pandas.Series元素作为拆分字符串的列表返回。

指定split = True作为参数可分为多个列并以pandas.DataFrame的形式获取。默认值为expand = False。

没有足够的行划分的元素为“无(None)”。

可以在列中指定获取的pandas.DataFrame的列名。

如果要通过将pandas.DataFrame的特定列拆分为多列来更新它,这会有些乏味。可能有更好的方法。

以先前创建的pandas.DataFrame为例。

在特定的列上使用str.split()获得一个拆分的pandas.DataFrame。

使用pd.concat()与原始pandas.DataFrame进行串联(联接),并使用drop()方法删除原始列。

如果剩余的列很少,则只能选择与pd.concat()串联(联接)时所需的列。

要重命名特定的列,请使用rename()方法。

参考文章

Pandas.DataFrame的行名和列名的修改

使用字符串方法str.extract()分割正则表达式。

以以下pandas.Series为例。

在第一个参数中指定正则表达式。对于每个与正则表达式中用()括起来的组部分匹配的字符串,均对其进行划分。

提取多个组时,无论参数expand如何,都将返回pandas.DataFrame。

如果不匹配,则为NaN。

如果只有一组,则当参数expand = True时返回pandas.DataFrame,如果expand = False则返回pandas.Series。

Expand = False是当前版本0.22.0中的默认值,但expand = True将是将来的默认值。

FutureWarning: currently extract(expand=None) means expand=False (return Index/Series/DataFrame)
but in a future version of pandas this will be changed to expand=True (return DataFrame)

如果对正则表达式模式使用命名组(?P …),则该名称将按原样是列名。

如果要通过将pandas.DataFrame的特定列划分为多个列来进行更新,请参考上面的str.split()示例。使用pd.concat()连接(联接)原始的pandas.DataFrame并使用drop()方法删除原始的列。

本文:Pandas怎么使用分隔符或正则表达式将字符串拆分为多列的详细内容,希望对您有所帮助,信息来源于网络。
上一篇:Python3 JSON数据解析、日期和时间转换的方法是什么下一篇:

6 人围观 / 0 条评论 ↓快速评论↓

(必须)

(必须,保密)

阿狸1 阿狸2 阿狸3 阿狸4 阿狸5 阿狸6 阿狸7 阿狸8 阿狸9 阿狸10 阿狸11 阿狸12 阿狸13 阿狸14 阿狸15 阿狸16 阿狸17 阿狸18