将嵌套的Json转换为特定格式的pandas DataFrame

13 浏览2023年6月13日

匿名的 2023年6月13日

0 Comments

我需要将一个Json文件的内容以特定的格式转换成pandas DataFrame，这样我就可以使用pandassql来转换数据并通过评分模型运行它。

file = C:\scoring_model\json.js  # 'file'的内容如下
{
  "response":{
    "version":"1.1",
    "token":"dsfgf",
    "body":{
      "customer":{
        "customer_id":"1234567",
        "verified":"true"
      },
      "contact":{
        "email":"[email protected]",
        "mobile_number":"0123456789"
      },
      "personal":{
        "gender": "m",
        "title":"Dr.",
        "last_name":"Muster",
        "first_name":"Max",
        "family_status":"single",
        "dob":"1985-12-23"
      }
    }
  }
}

我需要DataFrame的格式如下（显然，所有值在同一行上，为了这个问题，我尽量格式化得尽可能好）：

version | token | customer_id | verified | email      | mobile_number | gender |
1.1     | dsfgf | 1234567     | true     | [email protected] | 0123456789    | m      |
title | last_name | first_name |family_status | dob
Dr.   | Muster    | Max        | single       | 23.12.1985

我已经查看了关于这个主题的所有其他问题，尝试了各种加载Json文件到pandas的方法：

with open(r'C:\scoring_model\json.js', 'r') as f:
    c = pd.read_json(f.read())
with open(r'C:\scoring_model\json.js', 'r') as f:
    c = f.readlines()

尝试了在这个解决方案Python Pandas: How to split a sorted dictionary in a column of a dataframe中使用pd.Panel()和[yo = f.readlines()]的DataFrame结果。我考虑过尝试根据("")拆分每个单元格的内容，并找到一种将拆分后的内容放入不同列的方法，但迄今为止没有成功。

Python - 如何将JSON文件转换为Dataframe

如何使用字典从嵌套的JSON创建pandas数据帧。

使用Pandas解析从CSV加载的JSON字符串

MongoDB嵌套的JSON转换为Pandas数据帧/CSV。

将数据框转换为嵌套的jsonl文件

将Pandas DataFrame转换为部分嵌套的JSON。

读取JSON到pandas数据框 - ValueError: 混合使用字典和非Series可能导致排序不明确

将Pandas数据框转换为嵌套的JSON格式。

将Pandas数据帧转换为动态嵌套的JSON。

在pandas数据帧中阅读嵌套JSON时出现问题

解析csv文件中的json字符串

将包含多行JSON数据的文件加载到Pandas中。

如何扁平化多层/嵌套的JSON？

将Pandas DataFrame转换为JSON格式

如何将嵌套的JSON转换为Python数据框架

将json行数据分割成pandas数据框的多个列

PySpark：如何从spark数据帧创建嵌套的JSON？

从列表转换为数据框列

Pandas读取嵌套的JSON。

嵌套的JSON数组转换为Python Pandas DataFrame

将嵌套的Json转换为特定格式的pandas DataFrame

0 答案