更好的Python对象序列化方式

2024-05-10 23:46:26

许多Python标准库都有一些未被赏识的精华。其中之一是允许简单优雅的基于参数类型的函数分发。这一特性对于任意对象的序列化而言是非常完美的——例如对于web API的JSON或结构化日志而言。

谁应该都见过这个：

虽然这不是什么大问题。json模块（API继承自simplejson）提供了两种方式来序列化对象：

1. 实现一个default()函数，它接收一个对象作为参数并且返回可以被JSONEncoder理解的东西；

2. 你自己实现或子类化一个JSONEncoder，并且把它作为cls传递给dump方法。你可以自己实现它或者简单地重写JSONEncoder.default()方法。

由于一些第三方的实现希望能够被大多数程序兼容，所以他们都不同程度的模仿了json模块的API¹。

扩展性

所有上述方法的共性是它们不具有扩展性：不提供对新类型的支持。你的default()函数需要知道所有你想要序列化的自定义类型。这意味着你或者像这样写你的函数：

这看起来非常痛苦，因为你需要在一个地方为所有不同类型对象增加序列化结果²。

或者另一种方法，你可以自己尝试提出一种一般性的解决方案，就像Pyramid的JSON渲染器在JSON.add_adapter中做的一样，它使用了被广泛低估的zope.interface的适配器注册表³。

另一方面，Django自己实现了一个DjangoJSONEncoder，它是json.JSONEncoder的子类，它知道如何去编码日期，时间，UUID和premise等。但是除此之外，你又需要依靠自己了。如果你想深入研究Django和web API，那么你可能已经准备好使用Django的REST框架了。它们实现了一整套序列化系统，它比仅仅让数据进行json.dump()做了更多的工作。

最后，为了完整性，我感觉我不得不提到我自己在我第一天开始就极其讨厌的structlog中的解决方案：为你的类增加一个__structlog__方法，它会像__str__一样返回一个序列化后的表示方法。请不要重复我的错误。标签：software clown。

JSON已经很流行了，然而很奇怪的是我们对于序列化的解决方案却仍旧不够完善。我个人想要的是能够注册一个中心化的序列化工具，但是却以一个去中心化的方式来使用，这样可以不需要对我的类（或者更糟的，第三方类）进行任何修改。

进入PEP443

Python3.4以PEP 443的形式给出了对这个问题的一个好的解决方案：functools.singledispatch（老式Python版本也可以在PyPI上找到）。

简单说，你可以定义一个默认的函数然后根据第一个参数的类型注册一个该函数的额外版本：

现在你也可以对datetime实例调用to_serializable()方法，singledispatch会选择正确的函数

这一方法让你能够把你的序列化器放在任何你想放的位置：放在类里，在一个独立的模块里，或者放在JSON相关的代码里。你自己选！但是你的类要保持干净，并且你不需要巨大的繁琐的if-elif-else分支。

更深入一点

显然，@singledispatch的使用比JSON更加深入。一般而言，为不同类型的对象绑定不同的行为以及独立的序列化方式是普遍适用的⁴。我的一些校对员提到了他们尝试了采用字典类近似替代可调用对象以及其他一些类似的“残暴的”做法。

换句话说，@singledispatch就是一个长久以来就存在的但是却被你忽略的函数。

P.S. 当然，PyPI中也有一个*multiple*dispatch。

脚注

1. 然而，对于非常出名的一个：UltraJSON一点都不支持自定义对象的序列化，此外，python-rapidjson仅仅支持default()函数。

2. 利用attrs是可以很好管理的！也许你应当使用attrs!

3. 不幸的是Pyramid使用的API自从zope.component移植过来之后还没有形成文档。

4. 我听说将singlepatch加进标准库的最原始动力来自于对pprint的一个更优雅的实现（虽然从来没有实现过）

原文链接：https://hynek.me/articles/serialization/

文章转载：Python编程学习圈
（版权归原作者所有，侵删）

python IO编程（文件读写、StringIO和BytesIO、操作文件和目录、序列化）

学习目标: python学习十二. 学习内容: 1.文件读写 2.StringIO和BytesIO 3.操作文件和目录 4.序列化 1.文件读写读写文件就是请求操作系统打开一个文件对象(通常称为文件 ...
python测试开发django-118.json 解析查询数据库 datetime 格式问题

前言 django 查询的结果有日期时间格式的时候,返回的是datetime.datetime(2021, 9, 8, 0, 0)类型数据. 一般需要返回json格式数据,使用json.dumps() ...
python中的json、pickle

json 提供了四个功能: dumps:将json数据转换为字符串 json.dumps(obj,skipkeys=False,separators=None,sort_keys=False) loa ...
第34天：Python json&pickle

在日常开发中,对数据进行序列化和反序列化是常见的数据操作,Python提供了两个模块方便开发者实现数据的序列化操作,即 json 模块和 pickle 模块.这两个模块主要区别如下: json 是一个 ...
python基础之JSON标准库

一.序列化的一些简单概念我们平常使用的python对象所进行的操作是在内存中,当程序关闭就会被清空,所以我们需要用一种合适的方法将这些数据保存下来. 为了将我们的数据进行永久存储,需要引入序列化(p ...
Boston Dynamic（波士顿动力）开源相关-ProtoBuf描述

其实我应该是整理过这样的文章,就是稿子太多,遗失在草稿箱了.借着这次小米机械狗的由头,对这个也进行一些汇总.其实也没有开源多少... Boston Dynamics 关键词,任何搜索引擎都可以搜索的词 ...
Python源程序执行方式是什么？Python基础分享！

学习Python,我们需要掌握的知识点有很多,比如说源程序执行方式,那么你知道Python源程序执行方式有哪些吗?一般有三种方式,接下来我们一起来了解一下吧. Python源程序执行的方式有三种: 第 ...
月季玫瑰这样繁殖，比扦插繁殖长的更快，百分百生根的方式

月季玫瑰这样繁殖，比扦插繁殖长的更快，百分百生根的方式
【医书老师】怀孕前注意什么事项有助于让宝宝更聪明活泼？什么生活方式对生宝宝有坏处？

怀孕前注意什么事项有助于让宝宝更聪明活泼? 什么生活方式对生宝宝有坏处? 闲小豆医书老师提炼了<景岳全书>内<宜麟策>的部分内容,为你分享: 闲小豆,助力自然健康,拥抱美好人生 ...
如何写一个更好的Python函数？

Python虽然好用,但用好真的很难. 尤其是函数部分,只要写不好,后面的一连串人都会遭殃. 看又看不懂,测试起来也麻烦,维护又维护不动,真是让人头疼. 那怎么写好一个Python函数呢? <W ...
更靠谱的4G共享方式，让远程办公更方便，蒲公英X4C路由器体验

这两年5G网络已经完全普及了,但是相比于4G来说,5G的使用成本依然很高,而且偏远地区覆盖率较低,不适合长期使用.所以如果现在没有宽带的环境下稳定上网的话,4G路由器依然是非常靠谱的方案.近半年我就经 ...
低碳水比高碳水饮食更影响寿命？哪种方式最好？告诉你科学说法

不知从何时开始,"低碳水饮食"一词频繁出现在人的生活中,原先讲究的是减少碳排放,也就是低碳生活.现在变成了低碳水饮食,难道是让人们不吃主食吗? 事实上,这种说法在我国根本就不适用, ...
糖友，你感兴趣吗——用找对象的方式来寻找你的互助伙伴！

今天是元宵. 昨日因一位曾经满身争议的糖友离去的消息而夙夜难眠的会长,再次满血复活. 一解君前天的文章一解专栏:等生活中有了生老病死,才知道以前半夜的忧伤全是狗屁打动了很多糖友在后台留言.我也深以为 ...
用 Python + Appium 的方式自动化清理微信僵尸好友

来源:Python 技术「ID: pythonall」随着微信的使用时间越长,微信好友也越来越多,有些好友将你删除了你也不知道.当我们发消息的时候会出现下面扎心的一幕,然后默默将他删除使用 App ...
基金定投选星期几更划算？[python统计分析]

基金定投常见的一种方式是定期定额投资,即每周或每月固定的时间段,向基金公司申购固定份额的基金.基金定投可以平均成本.分散风险,实现自动投资,所以基金定投又称为"懒人投资术".今天主 ...

更好的Python对象序列化方式

相关推荐