Python造假数据,就用faker

标签: 人工智能  python  编程语言  html  数据挖掘

点击上方蓝色小字,关注涛哥聊Python

重磅干货,第一时间送达

项目开发初期,为了测试方便,我们总要造不少假数据到系统中,尽量模拟真实环境。

比如要创建一批用户名,创建一段文本,或者是电话号码,抑或是街道地址、IP地址等等。

平时我们基本是键盘一顿乱敲,随便造个什么字符串出来,当然谁也不认识谁。

现在你不要这样做了。

用faker就能满足你的一切需求。

先安装faker

pip install Faker

创建faker对象

from faker import Faker
fake = Faker()

fake 一个名字

>>> fake.name()
'Joshua Reed'

fake 一个地址

>>> fake.address()
'554 Hoffman Locks Suite 216\nElizabethstad, RI 23081'

fake 一个浏览器UA

>>> fake.chrome()
'Mozilla/5.0 (X11; Linux i686) AppleWebKit/532.0 (KHTML, like Gecko) Chrome/35.0.870.0 Safari/532.0'

fake 一个日期对象

>>> fake.date()
'1984-08-17'
>>> fake.date_object()
datetime.date(1980, 9, 27)

但凡是你需要的东西他都能帮你fake,如果你不知道它能fake哪些东西,可以用 dir(fake)查看一下。


它能fake近300种东西出来,如果还有你满足不了需求的,你可以像它的Github提交PR或者自己扩展

问题来了,上面fake的东西,比如名字,街道都是英文的,它支不支持中文呢?

肯定是可以的

只要在创建Faker对象的时候,指定语言就可以

>>> fake = Faker("zh_CN")
>>> fake.name()
'庄阳'
>>> fake.address()
'浙江省台北县沈北新北京街i座 285123'
>>> fake.phone_number()
'13223924289'

你会发现,fake的假数据还挺真实的。除了中文,它还支持日语、韩语、德语等上百种语言


当然,它还支持命令行模式

-h 查看帮助文档

faker [-h] [--version] [-o output]
      [-l {bg_BG,cs_CZ,...,zh_CN,zh_TW}]
      [-r REPEAT] [-s SEP]
      [-i {package.containing.custom_provider otherpkg.containing.custom_provider}]
      [fake] [fake argument [fake argument ...]]

C:\Users\lzjun\workspace\>faker name
Samantha Washington

问题又来了

我可不可以创建属于自己的fake数据呢?比如我想随机生成一个基于Android设备的User-Agent

from faker import Faker
fake = Faker()

from faker.providers import BaseProvider

# 创建自定义的provider
class MyProvider(BaseProvider):
    def android_ua(self):
        return 'xxxxxx'

# 添加一个provider
fake.add_provider(MyProvider)

>>>fake.android_ua()
>>>'xxxxxx'

是不是太简单了。不管你是fake一篇新闻还是fake一个老婆,都能用provider来实现。

另外,faker还是一个非常值得作为源码研究的库。

-END-

向大家推荐一个特别入门的零基础Python人工智能公开课

Python入门、零基础搞定毕业设计、最简单的人工智能大数据经典算法,极其简单好懂,每节课程都有干货案例。

观看地址

https://www.icourse163.org/course/CUEB-1450000234

https://www.bilibili.com/video/BV12p4y1X7JS/

课件下载

????长按上方二维码
回复「零基础」即可获取资料
其他
最后涛哥推荐下我的视频号,我从3月份开通了视频号,坚持录制70期左右的视频了,不说每篇干货满满,有爬虫技术,有工具推荐,有软件开发技能但都是原创用心输出,有些东西公众号看不到,视频号能看到,一来不足以成文,二来可以看看逗比涛哥。
今天是视频号71/100天打卡,公众号日更59/100天,加油呀!


版权声明:本文为wuShiJingZuo原创文章,遵循 CC 4.0 BY-SA 版权协议,转载请附上原文出处链接和本声明。
本文链接:https://blog.csdn.net/wuShiJingZuo/article/details/107398633

智能推荐

Intellij IDEA 搭建Spring Boot项目(一)

Intellij IDEA 搭建Spring Boot项目 标签(空格分隔): SpringBoot JAVA后台 第一步 选择File –> New –> Project –>Spring Initialer –> 点击Next  第二步 自己修改 Group 和 Artif...

CentOS学习之路1-wget下载安装配置

参考1: https://blog.csdn.net/zhaoyanjun6/article/details/79108129 参考2: http://www.souvc.com/?p=1569 CentOS学习之路1-wget下载安装配置 1.wget的安装与基本使用 安装wget yum 安装软件 默认安装保存在/var/cache/yum ,用于所有用户使用。 帮助命令 基本用法 例子:下载...

深入浅出Spring的IOC容器,对Spring的IOC容器源码进行深入理解

文章目录 DispatcherServlet整体继承图 入口:DispatcherServlet.init() HttpServletBean.init() FrameworkServlet.initServletBean() 首先大家,去看Spring的源码入口,第一个就是DispatcherServlet DispatcherServlet整体继承图 入口:DispatcherServlet....

laravel框架的课堂知识点概总

1. MVC 1.1 概念理解 MVC全名是Model View Controller,是模型(model)-视图(view)-控制器(controller)的缩写,一种软件设计典范,用一种业务逻辑、数据、界面显示分离的方法组织代码,将业务逻辑聚集到一个部件里面,在改进和个性化定制界面及用户交互的同时,不需要重新编写业务逻辑 MVC 是一种使用 MVC(Model View Controller ...

Unity人物角色动画系统学习总结

使用动画系统控制人物行走、转向、翻墙、滑行、拾取木头 混合树用来混合多个动画 MatchTarget用来匹配翻墙贴合墙上的某一点,人物以此为支点翻墙跳跃 IK动画类似于MatchTarget,控制两只手上的两个点来指定手的旋转和位置,使得拾取木头时更逼真 创建AnimatorController: 首先创建一个混合树,然后双击 可以看到该混合树有五种状态机,分别是Idle、WalkForward、...

猜你喜欢

Composer 安装 ThinkPHP6 问题

Composer 安装 ThinkPHP6 问题 先说说问题 一.运行环境要求 二.配置 参考: ThinkPHP6.0完全开发手册 先说说问题 执行ThinkPHP6的安装命令 遇到问题汇总如下: 看提示是要更新版本,执行命令更新。 更新之后,再次安装ThinkPHP,之后遇到如下问题。 尝试了很多方法,依然不能解决。其中包括使用https://packagist.phpcomposer.com...

Spring Boot 整合JDBC

今天主要讲解一下SpringBoot如何整合JDBC,没啥理论好说的,直接上代码,看项目整体结构 看一下对应的pom.xml 定义User.java 定义数据源配置,这里使用druid,所以需要写一个配置类 上面指定druid的属性配置,和用户登录的账号信息以及对应的过滤规则: 下面定义数据访问接口和对应的实现: 数据访问层很简单,直接注入JdbcTemplate模板即可,下面再看对应的servi...

html鼠标悬停显示样式

1.显示小手:     在style中添加cursor:pointer 实现鼠标悬停变成小手样式     实例:         其他参数: cursor语法: cursor : auto | crosshair | default | hand | move | help | wait | tex...

Yupoo(又拍网)的系统架构

Yupoo!(又拍网) 是目前国内最大的图片服务提供商,整个网站构建于大量的开源软件之上。以下为其使用到的开源软件信息: 操作系统:CentOS、MacOSX、Ubuntu 服务器:Apache、Nginx、Squid 数据库:MySQLmochiweb、MySQLdb 服务器监控:Cacti、Nagios、 开发语言:PHP、Python、Erlang、Java、Lua 分布式计算:Hadoop...

创建一个Servlet项目流程(入门)

版本 IDEA 2020.2 JDK1.8 apache-tomcat-9.0.36 项目流程 一、IDEA中新建JaveEE项目 项目起名,选择项目存放地址,点击finish创建成功 进入项目后,右键选择项目,选择add Framework Support 选择Web Application,点击OK 此时项目文件夹 在WEB-INF下创建两个目录classes和lib 按ctrl+alt+sh...