Come convertire JSON in oggetto Python
Python's json
library ha molte utilità per codificare e decodificare i dati in formato JSON. In particolare, il json.load()
Il metodo decodifica un JSON letto come file e il metodo json.loads()
decodificare un JSON letto come stringa. In generale, durante la decodifica dei file JSON, i dati vengono convertiti in dizionari Python, ma è possibile convertirli in un oggetto personalizzato utilizzando il parametro object_hook
.
Ad esempio, supponi di avere il seguente oggetto JSON:
json_obj = """{
"name" : "Felipe",
"email" : "[email protected]",
"age" : 29
}"""
e la seguente classe:
class User():
name : str
email : str
age : int
def __init__(self, input):
self.name = input.get("name")
self.email = input.get("email")
self.age = input.get("age")
Se chiamiamo json.loads()
con User
la object_hook
parametro, il User.__init__()
metodo verrà chiamato con il corrispondente del JSON dict
come ingresso.
import json
user = json.loads(json_obj, object_hook = User)
print(f"User {user.name}, age {user.age}, email {user.email}")
User Felipe, age 29, email [email protected]
Ma cosa succede se hai un JSON nidificato?
json.loads()
in realtà chiama il object_hook
funzione ogni volta che legge un oggetto JSON completamente formato dalla stringa. Si consideri il seguente JSON, restituito dal file API del generatore di utenti casuali
json_obj = """{
"gender": "male",
"name": {
"title": "Mr",
"first": "Ian",
"last": "Walters"
},
"location": {
"street": {
"number": 3161,
"name": "Saddle Dr"
},
"city": "Bendigo",
"state": "Western Australia",
"country": "Australia",
"postcode": 4285,
"coordinates": {
"latitude": "-84.7903",
"longitude": "-29.1020"
},
"timezone": {
"offset": "+9:00",
"description": "Tokyo, Seoul, Osaka, Sapporo, Yakutsk"
}
},
"email": "[email protected]",
"login": {
"uuid": "6ee5b2e8-01c3-4314-8f7f-80059f5dd9ec",
"username": "lazyzebra585",
"password": "walter",
"salt": "afXmogsa",
"md5": "a40e87023b57a4a60c7cb398584cbac3",
"sha1": "74caf43400be38cce60a8da2e6d1c367246505c2",
"sha256": "1becdf34bcc6704726c7e9b38821a5792f9dd0689d30789fb5e099a6e51e860a"
},
"dob": {
"date": "1947-06-06T02:45:41.895Z",
"age": 75
},
"registered": {
"date": "2003-03-25T00:15:32.791Z",
"age": 19
},
"phone": "06-9388-6976",
"cell": "0469-101-424",
"id": {
"name": "TFN",
"value": "561493929"
},
"picture": {
"large": "https://randomuser.me/api/portraits/men/32.jpg",
"medium": "https://randomuser.me/api/portraits/med/men/32.jpg",
"thumbnail": "https://randomuser.me/api/portraits/thumb/men/32.jpg"
},
"nat": "AU"
}"""
Stampiamo il JSON decodificato ad ogni passaggio per vedere cosa succede:
json.loads(json_obj, object_hook = print)
{'title': 'Mr', 'first': 'Ian', 'last': 'Walters'}
{'number': 3161, 'name': 'Saddle Dr'}
{'latitude': '-84.7903', 'longitude': '-29.1020'}
{'offset': '+9:00', 'description': 'Tokyo, Seoul, Osaka, Sapporo, Yakutsk'}
{'street': None, 'city': 'Bendigo', 'state': 'Western Australia', 'country': 'Australia', 'postcode': 4285, 'coordinates': None, 'timezone': None}
{'uuid': '6ee5b2e8-01c3-4314-8f7f-80059f5dd9ec', 'username': 'lazyzebra585', 'password': 'walter', 'salt': 'afXmogsa', 'md5': 'a40e87023b57a4a60c7cb398584cbac3', 'sha1': '74caf43400be38cce60a8da2e6d1c367246505c2', 'sha256': '1becdf34bcc6704726c7e9b38821a5792f9dd0689d30789fb5e099a6e51e860a'}
{'date': '1947-06-06T02:45:41.895Z', 'age': 75}
{'date': '2003-03-25T00:15:32.791Z', 'age': 19}
{'name': 'TFN', 'value': '561493929'}
{'large': 'https://randomuser.me/api/portraits/men/32.jpg', 'medium': 'https://randomuser.me/api/portraits/med/men/32.jpg', 'thumbnail': 'https://randomuser.me/api/portraits/thumb/men/32.jpg'}
{'gender': 'male', 'name': None, 'location': None, 'email': '[email protected]', 'login': None, 'dob': None, 'registered': None, 'phone': '06-9388-6976', 'cell': '0469-101-424', 'id': None, 'picture': None, 'nat': 'AU'}
So json.loads()
chiama il object_hook
funzione ogni volta che legge un JSON completamente formato, ovvero ogni volta che chiude una coppia di parentesi {}
. Quindi, crea l'intero oggetto JSON utilizzando il risultato del file object_hook
funzione - notare il None
(il valore di ritorno di print
) nell'ultima riga stampata.
Mostreremo due soluzioni per questo problema. Il primo è modificare il nostro User.__init__()
metodo per essere più flessibile rispetto all'input. Lo faremo usando il __dict__
attributo. Ogni oggetto Python ha un __dict__
attributo che contiene il nome e il valore di ogni attributo. Il nostro modificato __init__()
metodo aggiornerà questo dizionario:
class User():
def __init__(self, input):
self.__dict__.update(input)
user = json.loads(json_obj, object_hook = User)
print(f"User {user.name.first} {user.name.last}, age {user.dob.age}, email {user.email}")
Dai un'occhiata alla nostra guida pratica e pratica per l'apprendimento di Git, con le migliori pratiche, gli standard accettati dal settore e il cheat sheet incluso. Smetti di cercare su Google i comandi Git e in realtà imparare esso!
User Ian Walters, age 75, email [email protected]
Un'altra possibile soluzione consiste nell'utilizzare il file collections.namedtuple
classe:
from collections import namedtuple
def create_user(input):
User = namedtuple('User', input.keys())
return User(**input)
user = json.loads(json_obj, object_hook=create_user)
print(f"User {user.name.first} {user.name.last}, age {user.dob.age}, email {user.email}")
User Ian Walters, age 75, email [email protected]
where namedtuple('User', input.keys())
crea una sottoclasse tupla chiamata User
con le chiavi dell'input come nomi di attributi, e User(**input)
assegna i valori corrispondenti per gli attributi.