Hvordan konvertere JSON til Python-objekt
Pythons json
biblioteket har mange verktøy for koding og dekoding av data i JSON-format. Spesielt json.load()
metoden dekoder en JSON lest som en fil, og json.loads()
dekode en JSON lest som en streng. Generelt, ved dekoding av JSON-filer, konverteres dataene til Python-ordbøker, men det er mulig å konvertere dem til et tilpasset objekt ved å bruke parameteren object_hook
.
Anta for eksempel at du har følgende JSON-objekt:
json_obj = """{
"name" : "Felipe",
"email" : "[email protected]",
"age" : 29
}"""
og følgende klasse:
class User():
name : str
email : str
age : int
def __init__(self, input):
self.name = input.get("name")
self.email = input.get("email")
self.age = input.get("age")
Hvis vi ringer json.loads()
med User
som den object_hook
parameter, den User.__init__()
metoden kalles med JSONs tilsvarende dict
som input.
import json
user = json.loads(json_obj, object_hook = User)
print(f"User {user.name}, age {user.age}, email {user.email}")
User Felipe, age 29, email [email protected]
Men hva om du har en nestet JSON?
json.loads()
kaller faktisk object_hook
funksjon hver gang den leser et fullstendig utformet JSON-objekt fra strengen. Tenk på følgende JSON, returnert fra Random User Generator API
json_obj = """{
"gender": "male",
"name": {
"title": "Mr",
"first": "Ian",
"last": "Walters"
},
"location": {
"street": {
"number": 3161,
"name": "Saddle Dr"
},
"city": "Bendigo",
"state": "Western Australia",
"country": "Australia",
"postcode": 4285,
"coordinates": {
"latitude": "-84.7903",
"longitude": "-29.1020"
},
"timezone": {
"offset": "+9:00",
"description": "Tokyo, Seoul, Osaka, Sapporo, Yakutsk"
}
},
"email": "[email protected]",
"login": {
"uuid": "6ee5b2e8-01c3-4314-8f7f-80059f5dd9ec",
"username": "lazyzebra585",
"password": "walter",
"salt": "afXmogsa",
"md5": "a40e87023b57a4a60c7cb398584cbac3",
"sha1": "74caf43400be38cce60a8da2e6d1c367246505c2",
"sha256": "1becdf34bcc6704726c7e9b38821a5792f9dd0689d30789fb5e099a6e51e860a"
},
"dob": {
"date": "1947-06-06T02:45:41.895Z",
"age": 75
},
"registered": {
"date": "2003-03-25T00:15:32.791Z",
"age": 19
},
"phone": "06-9388-6976",
"cell": "0469-101-424",
"id": {
"name": "TFN",
"value": "561493929"
},
"picture": {
"large": "https://randomuser.me/api/portraits/men/32.jpg",
"medium": "https://randomuser.me/api/portraits/med/men/32.jpg",
"thumbnail": "https://randomuser.me/api/portraits/thumb/men/32.jpg"
},
"nat": "AU"
}"""
La oss skrive ut den dekodede JSON ved hvert trinn for å se hva som skjer:
json.loads(json_obj, object_hook = print)
{'title': 'Mr', 'first': 'Ian', 'last': 'Walters'}
{'number': 3161, 'name': 'Saddle Dr'}
{'latitude': '-84.7903', 'longitude': '-29.1020'}
{'offset': '+9:00', 'description': 'Tokyo, Seoul, Osaka, Sapporo, Yakutsk'}
{'street': None, 'city': 'Bendigo', 'state': 'Western Australia', 'country': 'Australia', 'postcode': 4285, 'coordinates': None, 'timezone': None}
{'uuid': '6ee5b2e8-01c3-4314-8f7f-80059f5dd9ec', 'username': 'lazyzebra585', 'password': 'walter', 'salt': 'afXmogsa', 'md5': 'a40e87023b57a4a60c7cb398584cbac3', 'sha1': '74caf43400be38cce60a8da2e6d1c367246505c2', 'sha256': '1becdf34bcc6704726c7e9b38821a5792f9dd0689d30789fb5e099a6e51e860a'}
{'date': '1947-06-06T02:45:41.895Z', 'age': 75}
{'date': '2003-03-25T00:15:32.791Z', 'age': 19}
{'name': 'TFN', 'value': '561493929'}
{'large': 'https://randomuser.me/api/portraits/men/32.jpg', 'medium': 'https://randomuser.me/api/portraits/med/men/32.jpg', 'thumbnail': 'https://randomuser.me/api/portraits/thumb/men/32.jpg'}
{'gender': 'male', 'name': None, 'location': None, 'email': '[email protected]', 'login': None, 'dob': None, 'registered': None, 'phone': '06-9388-6976', 'cell': '0469-101-424', 'id': None, 'picture': None, 'nat': 'AU'}
So json.loads()
kaller object_hook
funksjon hver gang den leser en fullstendig utformet JSON, det vil si hver gang den lukker et brakett-par {}
. Deretter oppretter den hele JSON-objektet ved å bruke resultatet av object_hook
funksjon – legg merke til None
(returverdien av print
) i den siste utskrevne linjen.
Vi vil vise to løsninger for dette problemet. Den første er å endre vår User.__init__()
metode for å være mer fleksibel med hensyn til input. Vi vil gjøre dette ved å bruke __dict__
Egenskap. Hvert Python-objekt har en __dict__
attributt som inneholder hvert attributts navn og verdi. Vår modifiserte __init__()
metoden vil oppdatere denne ordboken:
class User():
def __init__(self, input):
self.__dict__.update(input)
user = json.loads(json_obj, object_hook = User)
print(f"User {user.name.first} {user.name.last}, age {user.dob.age}, email {user.email}")
Sjekk ut vår praktiske, praktiske guide for å lære Git, med beste praksis, bransjeaksepterte standarder og inkludert jukseark. Slutt å google Git-kommandoer og faktisk lære den!
User Ian Walters, age 75, email [email protected]
En annen mulig løsning er å bruke collections.namedtuple
klasse:
from collections import namedtuple
def create_user(input):
User = namedtuple('User', input.keys())
return User(**input)
user = json.loads(json_obj, object_hook=create_user)
print(f"User {user.name.first} {user.name.last}, age {user.dob.age}, email {user.email}")
User Ian Walters, age 75, email [email protected]
hvor namedtuple('User', input.keys())
oppretter en tuppel underklasse kalt User
med inngangens nøkler som attributtnavn, og User(**input)
tilordner de tilsvarende verdiene for attributtene.