您的当前位置:首页正文

python 解读JSON文件,一文搞懂!

2024-11-17 来源:个人技术集锦

一、JSON格式详解

        所有 JSON 数据需要包裹在一个花括号中。

{
    "sites": [
    { "name":"maybe" , "url":"www.maybe.com" }, 
    { "name":"google" , "url":"www.google.com" }
    ]
}
  • Object(对象):键/值对("key":"value")的集合。集合使用花括号{ }定义。多个键/值对之间使用逗号,分隔,例如{"name":"pink","url":"unknown"}
  • Array(数组):值的有序集合,使用方括号[ ]定义,数组中每个值之间使用逗号 ,进行分隔。

1. 基本语法

  • 值可以是数字、字符串、布尔值、数组、对象、null;
  • 键必须是唯一的,不能重复;
  • 不可以使用八进制或十六进制表示数字。
  • 不支持注释
  • 可以嵌套

2. 数据类型

        number:JSON 中不区分整型和浮点型。此外,JSON 中不能使用八进制和十六进制表示数字,但可以使用 e 或 E 来表示 10 的指数。

{
    "number_1" : 20,
    "number_2" : -21.5,
    "number_3" : 1.0E+1
}  

        value:null 和 true/false

        object:JSON 中,对象由花括号{ }以及其中的若干键/值对组成,一个对象中可以包含零个或多个键/值对,每个键/值对之间需要使用逗号,分隔.

{
    "author": {
        "name": "C",
        "description": "C语言"
    }
}

        array:JSON 中,数组由方括号[ ]和其中的若干值组成,值可以是 JSON 中支持的任意类型,每个值之间使用逗号,进行分隔。

{
    "course" : [
        "JSON",
        "CSS",
        {
            "ok" : "well",
            "how" : "fine"
        },
        [
            3.1,
            fasle
        ],
        null
    ]
}

二、python

1. 数据文件(data.json)

{
    "employee": {
        "name": "John Doe",
        "age": 35,
        "department": {
            "name": "Engineering",
            "location": "Building A"
        }
    }
}

2.原生python解析

        需要导入JSON包进行文件解析。

import json

# 读取 JSON 数据
with open('data/data.json', 'r') as f:
    json_data = f.read()

# 解析 JSON 数据
data = json.loads(json_data)
print(type(data))  # dict

for key, value in data.items():  # 遍历第一层
    print(f"Key: {key}, Value: {value}")
    # 如果值是字典,继续遍历第二层
    if isinstance(value, dict):
        for sub_key, sub_value in value.items():  # 遍历第二层
            print(f"  Sub-key: {sub_key}, Sub-value: {sub_value}")
            # 如果第二层的值还是字典,进一步处理
            if isinstance(sub_value, dict):
                for deep_key, deep_value in sub_value.items():
                    print(f"    Deep-key: {deep_key}, Deep-value: {deep_value}")

3. pandas

        需要导入pandas包进行文件解析。

import pandas as pd

path = 'data/data.json'

# 1. 打开并读取 JSON 文件
df = pd.read_json(path)
print(type(df))  # DataFrame

# 2. 按行解析 JSON 数据
x = df.to_dict(orient='records')
print(type(x))  # list ,其中每个元素是一个字典

# 3. 按列解析 JSON 数据
y = df.to_dict(orient='list')
print(type(y))  # dict 类型,其中每个键的值是列表

# 4. 扁平化嵌套的 JSON 数据
x_normalized = pd.json_normalize(x)
print(x_normalized)

# 5. 将 DataFrame 转换为 JSON 格式
json_data = df.to_json()
print(json_data)

# 6. 将 DataFrame 写入 JSON 文件
df.to_json('output.json')

 

显示全文