Los datos ficticios son datos generados aleatoriamente que pueden sustituirse por datos en vivo. Tanto si es desarrollador, ingeniero de software o científico de datos, a veces necesita datos ficticios para probar lo que ha creado, puede ser una aplicación web, una aplicación móvil o un modelo de aprendizaje automático.
Si está utilizando el lenguaje python, puede usar un paquete faker python para crear datos ficticios de cualquier tipo, por ejemplo, fechas, transacciones, nombres, textos, hora y otros. Faker es un paquete de Python simple que genera datos falsos con diferentes tipos de datos. El paquete Faker está fuertemente inspirado en , y Ruby Faker. En este artículo, aprenderá una forma diferente de crear datos ficticios mediante el uso del paquete python de Faker.
pip install Faker
Nota: Desde la versión 4.0.0, Faker eliminó la compatibilidad con Python 2 y desde la versión 5.0.0 solo es compatible con Python 3.6 y superior.
from faker import Faker fake = Faker()
for _ in range( 10 ): print(fake.name())
mateo marrón
Sra. Julie Chávez
calvin pequeño
manuel ponce
Alyssa Jackson DVM
amy delgado
mateo smith
Sara Rojas
Cristal Werner
tina moore
Nota: También puede usar el método first_name() para crear el nombre y el método last_name() para crear el apellido.
print(fake.date_between(start_date= "-3y" ,end_date= "-1y" )) # date between 2018 and 2020 print(fake.month()) print(fake.date_time()) print(fake.year()) print(fake.month_name()) print(fake.date_time_this_year()) print(fake.time()) print(fake.timezone()) print(fake.day_of_week()) print(fake.time_object())
2019-05-31
02
2012-05-31 17:53:01
2002
Noviembre
2021-06-30 00:34:48
08:17:51
África/Gaborone
jueves
17:59:37
generateProfile = Faker() generateProfile.simple_profile()
{'usuario': 'qfowler',
'nombre': 'Mateo Greene',
'sexo': 'M',
'dirección': 'USNV López\nFPO AA 45803',
'correo': '[email protected]',
'fecha de nacimiento': fechahora.fecha(1995, 8, 14)}
generateProfile.profile()
{'empleo': 'Diseñador, plató de cine/televisión',
'compañía': 'Murillo, Short y Townsend',
'ssn': '893-14-6729',
'residencia': '6596 Daniel Spring Suite 910\nJonesborough, ID 59049',
'ubicación_actual': (Decimal('4.2622025'), Decimal('-39.109752')),
'grupo_sangre': 'O-',
'sitio web': ['//hardin-johnson.org/',
'//patterson.com/',
'//george-snyder.info/'],
'nombre de usuario': 'samuelbooth',
'nombre': 'Shawna Spencer',
'sexo': 'F',
'dirección': '125 Darrell Extension Suite 575\nPort Michaelbury, PA 12381',
'correo': '[email protected]',
'fecha de nacimiento': fechahora.fecha(1989, 11, 25)}
import pandas as pd generateProfile = Faker() # generate 1000 profiles data = [generateProfile.profile() for i in range( 1000 )] # save profiles in pandas dataframe df = pd.DataFrame(data) print(df)
print(df.columns)
Index(['trabajo', 'compañía', 'ssn', 'residencia', 'ubicación_actual', 'grupo_sanguíneo',
'sitio web', 'nombre de usuario', 'nombre', 'sexo', 'dirección', 'correo', 'fecha de nacimiento'], dtype='objeto')
(a) Crear un solo párrafo
generateText = Faker() generateText.text()
(b) Crear párrafos múltiples
generateTexts = Faker() generateTexts.texts()
['Juntos requieren aumentar la imagen de viento de crecimiento. El consumidor del árbol de tareas de producción reconoce personal.',
'Ser seis cuya respuesta. Sr. aceite exitoso bajo opción particular.\nPaso ni una sola subida. Ojo gracias prueba quedate solo servicio de prueba. Entonces senior dentro de la acción de capital. Pistola ya todo el jardín de letreros.',
'Pintura ahora término dirección. Será dentro de la barra natural propósito mayor.\nOtros oyen tema hacer su. La institución entre la educación se reiría de un ejemplo. Declaración real para niños específicos capaces extranjeros.']
(c) Crear una sola oración
generateSentence = Faker() generateSentence.sentence()
(d) Crear oraciones múltiples
generateSentences = Faker() generateSentences.sentences()
['Mantener toma estrella alguien podría empleado de cocina.',
'Pagar debe comenzar la palabra propia.',
'Lugar de ciudadano aunque viejo a pesar de la estancia.']
fake_local = Faker( 'zh_CN' ) for _ in range( 10 ): print(fake_local.name())
multiple_fake = Faker([ 'uk_UA' , 'en_US' , 'ja_JP' ]) for _ in range( 10 ): print(multiple_fake.city())
長生郡長生村
Christielandia
Rileyshire
長生郡白子町
Puerto Curtisborough
Pruittview
селище Одарка
хутір Богодар
село Альберт
横浜市都筑区
myGenerator = Faker() myGenerator.random.seed( 1234 ) for i in range( 10 ): print(myGenerator.country())
Eslovaquia (República Eslovaca)
Kazajistán
Brasil
Albania
islas Bermudas
Islas ultramarinas menores de los Estados Unidos
Sahara Occidental
Wallis y Futuna
Sri Lanka
Mozambique
Nota: Puede usar cualquier número aleatorio como semilla.
Y puedes leer más artículos como este aquí .
¿Quiere mantenerse al día con lo último en python? Suscríbase a nuestro boletín en el pie de página a continuación.