In [3]:
!pip install pymongo bs4
Requirement already satisfied: pymongo in /home/carlosb/miniconda3/envs/py37/lib/python3.7/site-packages (3.8.0)
Requirement already satisfied: bs4 in /home/carlosb/miniconda3/envs/py37/lib/python3.7/site-packages (0.0.1)
Requirement already satisfied: beautifulsoup4 in /home/carlosb/miniconda3/envs/py37/lib/python3.7/site-packages (from bs4) (4.7.1)
Requirement already satisfied: soupsieve>=1.2 in /home/carlosb/miniconda3/envs/py37/lib/python3.7/site-packages (from beautifulsoup4->bs4) (1.9.1)
In [4]:
from pymongo import MongoClient
connection = MongoClient("0.0.0.0", 27017)
In [5]:
first_values = list(connection.db_news.news.find())[0:20]
In [6]:
from bs4 import BeautifulSoup
In [29]:
soup = BeautifulSoup(first_values[10]['html'])
In [30]:
first_values[10]['tags']
Out[30]:
['Economía']
In [ ]:
In [23]:
tags_to_remove = ['script', 'head']
for tag in tags_to_remove:
for s in soup(tag):
s.extract()
In [24]:
soup
Out[24]:
<!DOCTYPE doctype html>
<html>
<body class="economia lv-story">
<!-- Static data layer definition -->
<!-- Google Tag Manager -->
<noscript>
<iframe height="0" src="//www.googletagmanager.com/ns.html?id=GTM-N4HLFJ>m_auth=V4CXbCtrd-365Wig2OOLAQ>m_preview=env-1>m_cookies_win=x" style="display: none; visibility: hidden" width="0"></iframe>
</noscript>
<!-- End Google Tag Manager --><div class="header">
<div class="header-pre-nav">
<div class="container">
<div class="header-tags">
<ul class="header-tags-list">
<li class="header-tags-item"><a class="header-tags-link" href="https://www.lavanguardia.com/sucesos/20190508/462125782190/natalia-sanchez-uribe-desaparecida-paris-localizada-hoy-en-directo.html" target="_self" title="Natalia Sánchez Uribe">Natalia Sánchez Uribe</a></li>
<li class="header-tags-item"><a class="header-tags-link" href="https://www.lavanguardia.com/television/20190508/462114718596/supervivientes-2019-en-tierra-de-nadie-isabel-pantoja-azucar-moreno-abandono-carlos-sobera.html" target="_self" title="Supervivientes 2019">Supervivientes 2019</a></li>
<li class="header-tags-item"><a class="header-tags-link" href="https://www.lavanguardia.com/gente/20190508/462124851235/meghan-markle-principe-harry-presentan-bebe-a-la-prensa-video-seo-lv.html" target="_self" title="Meghan Markle bebé">Meghan Markle bebé</a></li>
<li class="header-tags-item"><a class="header-tags-link" href="https://www.lavanguardia.com/series/20190508/462119799345/juego-de-tronos-sansa-violacion-frase-polemica.html" target="_self" title="Juego de Tronos">Juego de Tronos</a></li>
<li class="header-tags-item"><a class="header-tags-link" href="https://www.lavanguardia.com/television/20190508/462119630095/el-hormiguero-mote-antena-3-espectadora-llamada-cadena-triste-video.html" target="_self" title="Hormiguero">Hormiguero</a></li>
<li class="header-tags-item"><a class="header-tags-link" href="https://www.lavanguardia.com/20190508/462124001743/mossos-encuentran-indicios-janet-jumillas-muerta.html" target="_self" title="Janet Jumillas">Janet Jumillas</a></li>
<li class="header-tags-item"><a class="header-tags-link" href="https://www.lavanguardia.com/politica/20190508/462125413622/catalunya-juicio-proces-testigos-referendum-1-o-tribunal-supremo-hoy-en-directo.html" target="_self" title="Juicio del Procés">Juicio del Procés</a></li>
<li class="header-tags-item"><a class="header-tags-link" href="https://www.lavanguardia.com/politica/20190508/462124915641/miquel-iceta-presidente-senado.html" target="_self" title="Miquel Iceta">Miquel Iceta</a></li>
<li class="header-tags-item"><a class="header-tags-link" href="https://www.lavanguardia.com/vida/20190508/462063009558/entrevista-txell-costa-liderar-femenino.html" target="_self" title="Amor - Mujer">Amor - Mujer</a></li>
<li class="header-tags-item"><a class="header-tags-link" href="https://www.lavanguardia.com/deportes/tenis/20190508/462125559947/auger-aliassime-rafa-nadal-master-1000-madrid-2019-tenis-hoy-en-directo.html" target="_self" title="Nada- Masters 1000">Nada- Masters 1000</a></li>
<li class="header-tags-item"><a class="header-tags-link" href="https://www.lavanguardia.com/horoscopo/20190507/462000395563/horoscopo-hoy-miercoles-mayo-zodiaco.html" target="_self" title="Horóscopo">Horóscopo</a></li>
<li class="header-tags-item"><a class="header-tags-link" href="https://www.lavanguardia.com/deportes/futbol/20190508/462062811483/ajax-tottenham-amsterdam-champions-league-hf-semifinales-video-seo-ext.html" target="_self" title="Horario Ajax - Tottenham">Horario Ajax - Tottenham</a></li>
</ul>
</div>
<a class="header-login header-btn-login text-uppercase" href="#">
<i class="fa fa-user header-user-icon"></i>
<span class="header-login-txt hidden-xs myaccount-username">
Iniciar sesión
</span>
</a>
</div>
</div>
<div class="header-logo-channel header-normal-detail">
<div class="container">
<span class="icon-home-link" data-href="https://www.lavanguardia.com" data-href-id="header-logo-url" itemscope="itemscope" itemtype="https://schema.org/Organization">
<i class="icon-home"></i>
<link href="https://www.lavanguardia.com" itemprop="url"/>
<meta content="https://www.lavanguardia.com/rsc/images/lv-logo.svg?v=d6d8bbf4d00f1d09d28e8209432d9a7c8d33fccb" itemprop="logo"/>
<meta content="La Vanguardia" itemprop="name"/>
</span>
<a class="header-logo-link-channel" href="https://www.lavanguardia.com" id="header-logo-url" itemprop="url">
<figure>
<img alt="La Vanguardia" class="header-logo-image" itemprop="logo" rel="logo" src="https://www.lavanguardia.com/rsc/images/lv-logo.svg?v=d6d8bbf4d00f1d09d28e8209432d9a7c8d33fccb"><span class="header-logo-name" itemprop="name">La Vanguardia</span>
</img></figure>
</a>
<a class="header-logo-link" href="https://www.lavanguardia.com/economia" id="header-logo-url">
<span class="header-logo-text hidden-xs">Economía</span>
</a>
<input id="check-menusidebar" type="checkbox"/>
<label class="sidebar-background" for="check-menusidebar"></label>
<label class="icon-home-menu" for="check-menusidebar">
<i class="fa fa-bars"></i>
<i class="fa fa-close"></i>
</label>
<div class="text-left" id="sidebar">
<label class="sidebar-close" for="check-menusidebar">
<i class="fa fa-close"></i>
</label>
<div class="sidebar-container">
<ul class="col-md-2 header-menu-list" itemscope="" itemtype="https://schema.org/SiteNavigationElement">
<li itemprop="name"><a href="https://www.lavanguardia.com/alminuto" itemprop="url" target="_self">Al Minuto</a></li>
<li itemprop="name"><a href="https://www.lavanguardia.com/internacional" itemprop="url" title="Internacional">Internacional</a></li>
<li itemprop="name"><a href="https://www.lavanguardia.com/politica" itemprop="url" title="Política">Política</a></li>
<li itemprop="name"><a href="https://www.lavanguardia.com/opinion" itemprop="url" title="Opinión">Opinión</a></li>
<li itemprop="name"><a href="https://www.lavanguardia.com/vida" itemprop="url" title="Vida">Vida</a></li>
<li itemprop="name"><a href="https://www.lavanguardia.com/deportes" itemprop="url" title="Deportes">Deportes</a></li>
<li itemprop="name"><a href="https://www.lavanguardia.com/economia" itemprop="url" title="Economía">Economía</a></li>
<li itemprop="name"><a href="https://www.lavanguardia.com/local" itemprop="url" title="Local">Local</a></li>
<li itemprop="name"><a href="https://www.lavanguardia.com/gente" itemprop="url" title="Gente">Gente</a></li>
<li itemprop="name"><a href="https://www.lavanguardia.com/cultura" itemprop="url" title="Cultura">Cultura</a></li>
<li itemprop="name"><a href="https://www.lavanguardia.com/sucesos" itemprop="url" title="Sucesos">Sucesos</a></li>
<li itemprop="name"><a href="https://www.lavanguardia.com/temas" itemprop="url" title="Temas">Temas</a></li>
</ul>
<div class="sidebar-container-content">
<div>
<ul class="sidebar-channel-section col-md-2">
<li><span>Economía</span></li>
<li><a href="https://www.lavanguardia.com/servicios/bolsa">Cotización Bolsa</a></li>
<li><a href="https://www.lavanguardia.com/economia/management">Management</a></li>
<li><a href="https://www.lavanguardia.com/economia/finanzas-personales">Finanzas personales</a></li>
<li><a href="https://www.lavanguardia.com/economia/innovacion">Innovación&Tech</a></li>
<li><a href="https://www.lavanguardia.com/economia/emprendedores">Emprendedores</a></li>
<li><a href="/temas/consorci-de-la-zona-franca">Consorci de la Zona Franca</a></li>
<li><a href="/temas/negocio-digital">Negocio Digital</a></li>
</ul>
<ul class="sidebar-channel-section col-md-2">
<li><span>Canales</span></li>
<li itemprop="name"><a href="https://www.lavanguardia.com/lacontra" itemprop="url" title="La Contra">La Contra</a></li>
<li itemprop="name"><a href="https://www.lavanguardia.com/natural" itemprop="url" title="Natural">Natural</a></li>
<li itemprop="name"><a href="https://www.lavanguardia.com/ciencia" itemprop="url" title="Big Vang">Big Vang</a></li>
<li itemprop="name"><a href="https://www.lavanguardia.com/vida/salud" itemprop="url" title="Salud">Salud</a></li>
<li itemprop="name"><a href="https://www.lavanguardia.com/tecnologia" itemprop="url" title="Tecnología">Tecnología</a></li>
<li itemprop="name"><a href="https://www.lavanguardia.com/television" itemprop="url" title="Televisión">Televisión</a></li>
<li itemprop="name"><a href="https://www.lavanguardia.com/series" itemprop="url" title="Series">Series</a></li>
<li itemprop="name"><a href="https://www.lavanguardia.com/muyfan" itemprop="url" target="_self">Muy Fan</a></li>
<li itemprop="name"><a href="https://cribeo.lavanguardia.com/" itemprop="url" target="_self">Cribeo</a></li>
<li itemprop="name"><a href="https://www.lavanguardia.com/ocio/viajes" itemprop="url" title="Viajes">Viajes</a></li>
<li itemprop="name"><a href="https://www.lavanguardia.com/vivo" itemprop="url" title="Vivo">Vivo</a></li>
<li itemprop="name"><a href="https://www.lavanguardia.com/motor" itemprop="url" title="Motor">Motor</a></li>
<li itemprop="name"><a href="https://www.lavanguardia.com/de-moda" itemprop="url" title="De Moda">De Moda</a></li>
<li itemprop="name"><a href="https://www.lavanguardia.com/comer" itemprop="url" title="Comer">Comer</a></li>
</ul>
<ul class="sidebar-channel-section col-md-2">
<li><span>Ediciones locales</span></li>
<li itemprop="name"><a href="https://www.lavanguardia.com/local/madrid" itemprop="url" title="Madrid">Madrid</a></li>
<li itemprop="name"><a href="https://www.lavanguardia.com/local/barcelona" itemprop="url" title="Barcelona">Barcelona</a></li>
<li itemprop="name"><a href="https://www.lavanguardia.com/local/catalunya" itemprop="url" target="_self">Catalunya</a></li>
<li itemprop="name"><a href="https://www.lavanguardia.com/local/valencia" itemprop="url" title="Comunidad Valenciana">Comunidad Valenciana</a></li>
<li itemprop="name"><a href="https://www.lavanguardia.com/local/sevilla" itemprop="url" title="Andalucía">Andalucía</a></li>
<li itemprop="name"><a href="https://www.lavanguardia.com/local/paisvasco" itemprop="url" title="País Vasco">País Vasco</a></li>
<li itemprop="name"><a href="https://www.lavanguardia.com/local" itemprop="url" target="_self">Ver más</a></li>
</ul>
<ul class="sidebar-channel-section col-md-2">
<li><span>Servicios</span></li>
<li itemprop="name"><a href="https://parrilla-tv.lavanguardia.com" itemprop="url" target="_self">Programación TV</a></li>
<li itemprop="name"><a href="https://www.lavanguardia.com/cartelera" itemprop="url" target="_self">Cartelera</a></li>
<li itemprop="name"><a href="https://www.lavanguardia.com/horoscopo" itemprop="url" target="_self">Horóscopo</a></li>
<li itemprop="name"><a href="https://www.lavanguardia.com/loterias" itemprop="url" target="_self">Loterías</a></li>
</ul>
</div>
</div>
</div>
</div>
</div>
</div>
<div class="navbar-section visible-xs">
<div class="container">
<a href="https://www.lavanguardia.com/economia">
<span>Economía</span>
</a>
</div>
</div></div><div class="main">
<div>
<div class="container block container-newtiquer">
<div class="row">
<div class="col-xs-12 col-sm-12 col-md-12 tiquer-column">
<div class="newtiquer newtiquer-blue">
<div class="newtiquer__label">
<span class="text-nowrap">Última hora</span>
</div>
<a class="newtiquer__title" href="https://www.lavanguardia.com/sucesos/20190508/462125782190/natalia-sanchez-uribe-desaparecida-paris-en-directo.html" target="_blank" title="Hallada con vida a Natalia Sánchez Uribe, la joven desaparecida en París">Hallada con vida a Natalia Sánchez Uribe, la joven desaparecida en París</a>
</div>
</div>
</div>
</div>
<div class="container block container-newtiquer">
<div class="row">
<div class="col-xs-12 col-sm-12 col-md-12 tiquer-column">
<div class="newtiquer newtiquer-blue">
<div class="newtiquer__label">
<span class="text-nowrap">Tenis</span>
</div>
<a class="newtiquer__title" href="https://www.lavanguardia.com/deportes/tenis/20190508/462125559947/auger-aliassime-rafa-nadal-master-1000-madrid-2019-tenis-hoy-en-directo.html" target="_blank" title="Sigue en directo el Auger-Aliassime - Nadal, del Masters 1.000 de Madrid">Sigue en directo el Auger-Aliassime - Nadal, del Masters 1.000 de Madrid</a>
</div>
</div>
</div>
</div>
<div class="container block container-newtiquer">
<div class="row">
<div class="col-xs-12 col-sm-12 col-md-12 tiquer-column">
<div class="newtiquer newtiquer-blue">
<div class="newtiquer__label">
<span class="text-nowrap">Directo</span>
</div>
<a class="newtiquer__title" href="https://www.lavanguardia.com/politica/20190508/462125413622/catalunya-juicio-proces-testigos-referendum-1-o-tribunal-supremo-hoy-en-directo.html" target="_blank" title="Juicio al ‘procés’: declaran más votante del 1-O citados por la defensa">Juicio al ‘procés’: declaran más votante del 1-O citados por la defensa</a>
</div>
</div>
</div>
</div>
</div><div class="main__structure">
<div class="story-ptr header-structure text-right">
<p class="story-ptr-label">Ofrecido por:<a class="story-ptr-link" href="www.nacidosparaserautonomos.es" target="_blank">
<img alt="Ofrecido por:" class="img-responsive" data-src="https://www.lavanguardia.com/r/GODO/LV/p6/WebSite/2019/04/24/img_jcanyissa_20190506-140154_imagenes_lv_terceros_orange32.gif" onload="gg.util.setImgSrc(this);" src="https://www.lavanguardia.com/rsc/images/3_1.gif"/></a>
</p>
</div>
<article class="container story-leaf" itemscope="" itemtype="https://schema.org/NewsArticle">
<meta content="https://www.lavanguardia.com/economia/20190508/462100000984/es-tan-dificil-negocio-espana-brl.html" itemprop="mainEntityOfPage"/>
<meta content="Economía" itemprop="articleSection"/>
<div itemprop="publisher" itemscope="" itemtype="https://schema.org/Organization">
<meta content="La Vanguardia" itemprop="name"/>
<link href="https://www.lavanguardia.com" itemprop="sameAs"/>
<div itemprop="logo" itemscope="" itemtype="https://schema.org/ImageObject">
<meta content="https://www.lavanguardia.com/rsc/images/logo-lv.png" itemprop="url">
<meta content="300" itemprop="width"/>
<meta content="32" itemprop="height"/>
</meta></div>
</div>
<!-- Header -->
<header class="story-leaf-header row header-structure">
<div class="col-xs-12 col-md-2">
<span class="row story-leaf-epigraph text-uppercase">Autónomos</span>
</div>
<h1 class="story-leaf-title col-xs-12 col-md-10" itemprop="headline">¿Es tan difícil abrir un negocio en España?</h1>
</header>
<div class="header-structure">
<div class="row">
<hr class="line-separator visible-md"/>
<div class="col-xs-12 col-md-2 visible-md">
<div class="story-leaf-social-btns story-leaf-social-comments" data-gtm-element="leaf-social-share-top">
<a class="btn-social btn-facebook" data-gtm-social-provider="facebook" href="https://www.facebook.com/sharer/sharer.php?u=https://www.lavanguardia.com/economia/20190508/462100000984/es-tan-dificil-negocio-espana-brl.html" target="_blank">
<i class="fa fa-facebook"></i>
<span class="btn-label">Comparte en Facebook</span>
</a>
<a class="btn-social btn-twitter" data-gtm-social-provider="twitter" href="https://twitter.com/intent/tweet?text=¿Es tan difícil abrir un negocio en España?&url=https://www.lavanguardia.com/economia/20190508/462100000984/es-tan-dificil-negocio-espana-brl.html" target="_blank">
<i class="fa fa-twitter"></i>
<span class="btn-label">Comparte en Twitter</span>
</a>
<a class="btn-social btn-whatsapp hidden-md" data-gtm-social-provider="whatsapp" href="whatsapp://send?text=%C2%BFEs%20tan%20dif%C3%ADcil%20abrir%20un%20negocio%20en%20Espa%C3%B1a%3F%20https%3A%2F%2Fwww.lavanguardia.com%2Feconomia%2F20190508%2F462100000984%2Fes-tan-dificil-negocio-espana-brl.html%3Futm_campaign%3Dbotones_sociales%26utm_source%3Dwhatsapp%26utm_medium%3Dsocial">
<i class="fa fa-whatsapp"></i>
<span class="btn-label">Comparte en Whatsapp</span>
</a><div class="story-leaf-comment-count">
<a href="#linkcomments">
<i class="fa fa-comment"></i> <label class="livefyre-commentcount" data-counter="total" data-lf-article-id="556146c8-70b6-11e9-a2d7-a6123c8a8dd4" data-lf-site-id="351112">0</label></a>
</div>
</div>
</div>
<h2 class="story-leaf-subtitle-item col-md-10" itemprop="alternativeHeadline">Para poner en marcha una empresa hacen falta 12 días y 7 procedimientos en territorio nacional, mientras que en Nueva Zelanda son necesarias solo 12 horas</h2>
<hr class="line-separator margin-b20 visible-md"/>
<div class="col-xs-12 col-md-10 col-md-push-2 nopadding-xs">
<figure class="story-leaf-figure" data-component="image" itemprop="image" itemscope="" itemtype="https://schema.org/ImageObject">
<meta content="558" itemprop="height">
<meta content="992" itemprop="width">
<meta content="https://www.lavanguardia.com/r/GODO/LV/p6/WebSite/2019/05/07/Recortada/img_ellopart_20190507-125609_imagenes_lv_getty_ff-kEYC-U462100000984YeD-992x558@LaVanguardia-Web.jpg" itemprop="url">
<img alt="¿Es tan difícil abrir un negocio en España?" class="img-responsive" src="https://www.lavanguardia.com/r/GODO/LV/p6/WebSite/2019/05/07/Recortada/img_ellopart_20190507-125609_imagenes_lv_getty_ff-kEYC-U462100000984YeD-992x558@LaVanguardia-Web.jpg"/></meta></meta></meta></figure>
</div>
<div class="col-xs-12 col-md-2 hidden-md">
<div class="story-leaf-social-btns story-leaf-social-comments" data-gtm-element="leaf-social-share-top">
<a class="btn-social btn-facebook" data-gtm-social-provider="facebook" href="https://www.facebook.com/sharer/sharer.php?u=https://www.lavanguardia.com/economia/20190508/462100000984/es-tan-dificil-negocio-espana-brl.html" target="_blank">
<i class="fa fa-facebook"></i>
<span class="btn-label">Comparte en Facebook</span>
</a>
<a class="btn-social btn-twitter" data-gtm-social-provider="twitter" href="https://twitter.com/intent/tweet?text=¿Es tan difícil abrir un negocio en España?&url=https://www.lavanguardia.com/economia/20190508/462100000984/es-tan-dificil-negocio-espana-brl.html" target="_blank">
<i class="fa fa-twitter"></i>
<span class="btn-label">Comparte en Twitter</span>
</a>
<a class="btn-social btn-whatsapp hidden-md" data-gtm-social-provider="whatsapp" href="whatsapp://send?text=%C2%BFEs%20tan%20dif%C3%ADcil%20abrir%20un%20negocio%20en%20Espa%C3%B1a%3F%20https%3A%2F%2Fwww.lavanguardia.com%2Feconomia%2F20190508%2F462100000984%2Fes-tan-dificil-negocio-espana-brl.html%3Futm_campaign%3Dbotones_sociales%26utm_source%3Dwhatsapp%26utm_medium%3Dsocial">
<i class="fa fa-whatsapp"></i>
<span class="btn-label">Comparte en Whatsapp</span>
</a><div class="story-leaf-comment-count">
<a href="#linkcomments">
<i class="fa fa-comment"></i> <label class="livefyre-commentcount" data-counter="total" data-lf-article-id="556146c8-70b6-11e9-a2d7-a6123c8a8dd4" data-lf-site-id="351112">0</label></a>
</div>
</div>
</div>
<div class="col-xs-12 col-md-2 col-md-pull-10 story-leaf-infobox">
<div class="row story-leaf-author nopadding">
<div class="story-leaf-author-link text-uppercase" itemprop="author" itemscope="" itemtype="https://schema.org/Person">
<span class="story-leaf-author-link text-uppercase" data-link-name="auto tag link" itemprop="name">José Manuel Rodríguez</span></div>
<time class="story-leaf-datetimepub" data-timestamp="1557266700000" datetime=" 2019-05-08T00:05:00+0200">
08/05/2019 00:05</time>
<time class="story-leaf-datetime" data-timestamp="1557302305000" datetime=" 2019-05-08T09:58:25+0200" itemprop="dateModified">
<span class="hidden-md"> | </span> <span class="story-leaf-datetime_block">Actualizado a </span> 08/05/2019 09:58</time>
<meta content="2019-05-08T00:05:00+0200" itemprop="datePublished"/>
<meta content="2019-05-08T00:05:00+0200" itemprop="datePublished"/>
</div>
</div>
</div>
</div>
<div class="content-structure">
<div class="story-leaf-txt-p" data-gtm-element-container="modulo-texto-link" itemprop="articleBody">
<p>La última edición del informe Doing Business del Banco Mundial deja un margen escaso de alegría para los autónomos españoles. Las jornadas y trámites necesarios para emprender han descendido en los últimos años, pero mantienen a <b>España en un discreto puesto 86</b> de los 190 países analizados. Eso influye en el dinamismo de la economía nacional, ya que el alrededor del <b>95% de las empresas</b> que la sustentan tienen menos de nueve trabajadores. </p>
<span class="block-element" data-video-owner="other">
<span class="block-element story-leaf-body-video marginb20" itemprop="Video" itemscope="" itemtype="https://schema.org/VideoObject">
<meta content="¿Es tan difícil abrir un negocio en España?" itemprop="name"/>
<meta content="https://img.youtube.com/vi/Lq4FY0X5CHY/maxresdefault.jpg" itemprop="thumbnailUrl"/>
<meta content="¿Es tan difícil abrir un negocio en España?" itemprop="description"/>
<meta content="https://www.youtube.com/embed/Lq4FY0X5CHY" itemprop="embedURL"/>
<meta content="2019-05-08T09:58:25+0200" itemprop="uploadDate"/>
<iframe allowfullscreen="" frameborder="0" mozallowfullscreen="" src="https://www.youtube.com/embed/Lq4FY0X5CHY" webkitallowfullscreen="" width="100%"></iframe>
</span>
</span>
<p>Hoy son necesarios <b>12,5 días y 7 procedimientos </b>para que un negocio eche a andar en territorio español, cifras que pueden parecer excelentes comparadas con las 138 jornadas que había que esperar en 2003. Pero esos datos palidecen frente a las 12 horas que le cuesta a un emprendedor neocelandés empezar a funcionar o el día y medio que tiene que esperar un canadiense. </p>
<span class="despiece-story">
<span class="despiece-story-title">
<h3 class="despiece-story-title-text"><p>Las jornadas y trámites necesarios para emprender han descendido en los últimos años, pero mantienen a España en un discreto puesto 86 de los 190 países analizados</p>
</h3>
</span>
</span><p>¿Por qué en España hay que esperar y tramitar más para crear un negocio? La gestora y asesora fiscal Mercedes L. Arcis, de la empresa Soluzzion, considera que la apertura de un local al público es lo que realmente retrasa y complica cualquier proyecto: <b>“Lleva demasiado tiempo y exigencias de distintas administraciones locales a nivel de seguridad, sanidad, accesibilidad”</b>. </p>
<p>En la práctica, las normativas nacionales, autonómicas y locales pueden contradecirse y están sometidas a posibles problemas de interpretación. En este sentido,<a data-gtm-element="container-child-link" href="http://nacidosparaserautonomos.es/?utm_source=Lavanguardia&utm_medium=brandedContent&utm_term=&utm_content=ampliacion+noticia&utm_campaign=Autonomos_Burocracia" rel="nofollow noreferrer" target="_blank"> la campaña de Orange</a>
<b>
<a data-gtm-element="container-child-link" href="http://nacidosparaserautonomos.es/?utm_source=Lavanguardia&utm_medium=brandedContent&utm_term=&utm_content=ampliacion+noticia&utm_campaign=Autonomos_Burocracia" rel="nofollow noreferrer" target="_blank"> ‘Nacidos para ser autónomos’</a> </b>funciona como altavoz de la realidad de un colectivo que necesita ser escuchado y entendido por la sociedad española. </p>
<span class="block-element" itemprop="image" itemscope="" itemtype="https://schema.org/ImageObject">
<figure class="story-leaf-body-image">
<img alt="" class="img-responsive" src="https://www.lavanguardia.com/r/GODO/LV/p6/WebSite/2019/05/07/Recortada/img_ellopart_20190507-125418_imagenes_lv_getty_foto_2-kEYC--656x438@LaVanguardia-Web.jpg"/>
<meta content="438" itemprop="height"/>
<meta content="656" itemprop="width"/>
<meta content="https://www.lavanguardia.com/r/GODO/LV/p6/WebSite/2019/05/07/Recortada/img_ellopart_20190507-125418_imagenes_lv_getty_foto_2-kEYC--656x438@LaVanguardia-Web.jpg" itemprop="url"/>
</figure>
</span><p>La solución lógica a esta problemática es la creación de una ventanilla única que permita al emprendedor satisfacer todos los requisitos exigidos por distintas capas de la Administración, pero eso requiere una coordinación a menudo inexistente. Por ello el 61,1% de los expertos consultados en<b> el informe Global Entrepeneurship Monitor (GEM) 2017-2018 </b>coinciden en que el exceso de trámites supone la principal dificultad en la creación de empresas en España. Y estas condiciones desaniman a personas interesadas en convertirse en profesionales autónomos. </p>
<p>La <b>Confederación Española de la Pequeña y Mediana Empresa (CEPYME)</b> hizo público un documento con propuestas de cara a las elecciones generales de 2019 cuyo argumentario incluía la aplicación del principio “pensar primero en pequeña escala”, que implica mejorar la regulación a todos los niveles para que las pymes puedan crearse con las mínimas trabas administrativas posibles. También apelaba a la instauración de la regla de “una única vez”, para evitar que distintos agentes administrativos pidan a emprendedores información que ya tienen. </p>
<span class="despiece-story">
<span class="despiece-story-title">
<h3 class="despiece-story-title-text"><p>La Confederación Española de la Pequeña y Mediana Empresa hizo pública su propuesta de mejorar la regulación para que las pymes puedan abrirse con las mínimas trabas administrativas </p>
</h3>
</span>
</span><p>Para que ambos principios puedan aplicarse es imprescindible la mejora en la digitalización de la relación de ciudadanos y empresas con el Estado, algo en lo que España lleva trabajando desde octubre de 2016 con la entrada en vigor de dos leyes específicas. <b>“Internet ha supuesto un avance espectacular, a pesar de que la Administración no está siendo todo lo rápida que sería deseable, sobre todo la Seguridad Social”</b>, apunta la experta de Soluzzion. </p>
<p>De hecho, el <b>Observatorio de Competitividad Empresarial de la Cámara de Comercio de España</b> ya indicaba en su edición de 2017 que más del 85% de las pymes, micropymes y autónomos encuestados consideraban probable o muy probable invertir recursos en digitalización, precisamente para mejorar su relación con las instituciones públicas. El objetivo es ahorrar tiempo y dinero a la hora de cumplir con las exigencias administrativas, sin incurrir en riesgo de sanciones. </p>
<span class="block-element" data-video-owner="other">
<span class="block-element story-leaf-body-video marginb20">
<iframe allowfullscreen="" frameborder="0" mozallowfullscreen="" src="https://www.youtube.com/embed/aKBWWTs2BF4" webkitallowfullscreen="" width="100%"></iframe>
</span>
</span>
<p>
<b>La ley de Reformas urgentes del Trabajo Autónomo aprobada en octubre de 2017 </b>introdujo varias mejoras para los profesionales por cuenta propia, entre ellas la reducción de la carga administrativa de quienes trabajen a la vez para otros y para sí mismos. Como consecuencia, Seguridad Social devuelve ahora de oficio el exceso de cotización por ambos empleos. Hasta la aprobación de esa normativa eran los profesionales en esta situación los que debían solicitarla y demostrar la validez de su petición. </p>
<span class="despiece-story">
<span class="despiece-story-title">
<h3 class="despiece-story-title-text"><p>La ley de Reformas urgentes del Trabajo Autónomo de 2017 introdujo la reducción de la carga administrativa de quienes trabajen a la vez para otros y para sí mismos </p>
</h3>
</span>
</span><p>Facilitar esa fórmula mixta supone atender mejor a las dinámicas cambiantes de una realidad laboral cada vez más flexible y permitir que cualquier persona pueda poner en marcha proyectos propios. De los más de <b>3,2 millones de registrados en el Régimen Especial de Trabajadores Autónomos</b>, casi dos millones lo son como persona física y los restantes como societarios. </p>
<p>Un entorno amable para el emprendimiento permite que un profesional independiente haga evolucionar su proyecto desde una actividad individual a empezar a generar empleo. De hecho, <b>uno de cada cinco trabajadores que ejerce como autónomo</b> en régimen de persona física tiene al menos a un trabajador a su cargo. Para mejorar estas cifras y seguir combatiendo el desempleo, la reducción de las cargas burocráticas es esencial.</p>
</div>
</div>
</article>
<div class="publi-structure">
<section class="widget-mostviewed clearfix" role="complementary">
<div class="story-leaf-recommended-stories" data-gtm-element-container="modulo-outbrain-lv">
<div class="OUTBRAIN" data-gtm-element-container="modulo-outbrain-paid" data-ob-template="lavanguardia" data-src="https://www.lavanguardia.com/economia/20190508/462100000984/es-tan-dificil-negocio-espana-brl.html" data-widget-id="AR_22"></div>
</div>
</section>
<section class="widget-mostviewed clearfix" role="complementary">
<div class="story-leaf-recommended-stories" data-gtm-element-container="modulo-outbrain-lv">
<div class="OUTBRAIN" data-ob-template="lavanguardia" data-src="https://www.lavanguardia.com/economia/20190508/462100000984/es-tan-dificil-negocio-espana-brl.html" data-widget-id="AR_21"></div>
<div class="OUTBRAIN" data-ob-template="lavanguardia" data-src="https://www.lavanguardia.com/economia/20190508/462100000984/es-tan-dificil-negocio-espana-brl.html" data-widget-id="AR_23"></div>
<div class="OUTBRAIN" data-gtm-element-container="modulo-outbrain-md" data-ob-template="lavanguardia" data-src="https://www.lavanguardia.com/economia/20190508/462100000984/es-tan-dificil-negocio-espana-brl.html" data-widget-id="AR_24"></div>
</div>
</section>
</div>
<div class="footer-structure">
<div class="visible-md visible-lg">
<div class="col-xs-12 col-md-8">
<section class="story-leaf-block-comments" role="complementary">
<div class="row story-row">
<div class="col-xs-12 col-sm-6 col-md-12">
<div class="story-leaf-comments-content">
</div>
</div>
</div>
</section>
</div>
<div class="col-xs-12 col-md-4">
<div class="sticky-container sticky-latest-news">
<div id="comments-sticky-ad-roba-md-6235777">
<div class="sticky-latest-news">
<div class="latest-news">
<div class="latest-news__title">Últimas noticias</div>
<div class="latest-news__article"><a href="https://www.lavanguardia.com/deportes/baloncesto/20190508/462126481254/panathinaikos-olympiacos-baloncesto-arbitro.html" title="El Panathinaikos acusa a Olympiacos de “terrorismo y anarquía”">El Panathinaikos acusa a Olympiacos de “terrorismo y anarquía”</a></div>
<div class="latest-news__article"><a href="https://www.lavanguardia.com/videojuegos/20190508/462126425571/videojuegos-pokemon-go-niantic-nintendo-filtracion-leafeon-glaceon-probopass-magnezone.html" title="Pokémon Go: se filtra la futura llegada de Leafeon, Glaceon, Probopass y Magnezone">Pokémon Go: se filtra la futura llegada de Leafeon, Glaceon, Probopass y Magnezone</a></div>
<div class="latest-news__article"><a href="https://www.lavanguardia.com/local/tarragona/20190508/462126411386/detenidos-robar-mil-kilos-cable-telefonico-cobre-tarragona.html" title="Dos detenidos por robar mil kilos de cable telefónico en Tarragona">Dos detenidos por robar mil kilos de cable telefónico en Tarragona</a></div>
<div class="latest-news__article"><a href="https://www.lavanguardia.com/sucesos/20190508/462126449801/condenado-violador-martorell-reincidir-permiso-penitenciario.html" title="Condenado a 70 años el violador de Martorell por reincidir en un permiso">Condenado a 70 años el violador de Martorell por reincidir en un permiso</a></div>
<div class="latest-news__article"><a href="https://www.lavanguardia.com/sucesos/20190508/462125782190/natalia-sanchez-uribe-desaparecida-paris-en-directo.html" title="Natalia Sánchez, última hora hoy de la desaparecida en París">Natalia Sánchez, última hora hoy de la desaparecida en París</a></div>
<div class="latest-news__article"><a href="https://www.lavanguardia.com/local/valencia/20190508/462125411714/antonio-canizares-pp-valenciano-vox-ideologia-de-genero-lgtbi.html" title="Miembros del PP valenciano creen que algunos mensajes del cardenal Cañizares han ayudado a VOX">Miembros del PP valenciano creen que algunos mensajes del cardenal Cañizares han ayudado a VOX</a></div>
</div></div>
</div>
</div>
</div>
</div>
<div class="visible-xs visible-sm">
<div class="col-xs-12 col-md-8">
<section class="story-leaf-block-comments" role="complementary">
<div class="row story-row">
<div class="col-xs-12 col-sm-6 col-md-12">
<div class="story-leaf-comments-content">
</div>
</div>
</div>
</section>
</div>
<div class="col-xs-12 col-md-4">
<div class="latest-news">
<div class="latest-news__title">Últimas noticias</div>
<div class="latest-news__article"><a href="https://www.lavanguardia.com/deportes/baloncesto/20190508/462126481254/panathinaikos-olympiacos-baloncesto-arbitro.html" title="El Panathinaikos acusa a Olympiacos de “terrorismo y anarquía”">El Panathinaikos acusa a Olympiacos de “terrorismo y anarquía”</a></div>
<div class="latest-news__article"><a href="https://www.lavanguardia.com/videojuegos/20190508/462126425571/videojuegos-pokemon-go-niantic-nintendo-filtracion-leafeon-glaceon-probopass-magnezone.html" title="Pokémon Go: se filtra la futura llegada de Leafeon, Glaceon, Probopass y Magnezone">Pokémon Go: se filtra la futura llegada de Leafeon, Glaceon, Probopass y Magnezone</a></div>
<div class="latest-news__article"><a href="https://www.lavanguardia.com/local/tarragona/20190508/462126411386/detenidos-robar-mil-kilos-cable-telefonico-cobre-tarragona.html" title="Dos detenidos por robar mil kilos de cable telefónico en Tarragona">Dos detenidos por robar mil kilos de cable telefónico en Tarragona</a></div>
<div class="latest-news__article"><a href="https://www.lavanguardia.com/sucesos/20190508/462126449801/condenado-violador-martorell-reincidir-permiso-penitenciario.html" title="Condenado a 70 años el violador de Martorell por reincidir en un permiso">Condenado a 70 años el violador de Martorell por reincidir en un permiso</a></div>
<div class="latest-news__article"><a href="https://www.lavanguardia.com/sucesos/20190508/462125782190/natalia-sanchez-uribe-desaparecida-paris-en-directo.html" title="Natalia Sánchez, última hora hoy de la desaparecida en París">Natalia Sánchez, última hora hoy de la desaparecida en París</a></div>
<div class="latest-news__article"><a href="https://www.lavanguardia.com/local/valencia/20190508/462125411714/antonio-canizares-pp-valenciano-vox-ideologia-de-genero-lgtbi.html" title="Miembros del PP valenciano creen que algunos mensajes del cardenal Cañizares han ayudado a VOX">Miembros del PP valenciano creen que algunos mensajes del cardenal Cañizares han ayudado a VOX</a></div>
</div></div>
</div>
</div>
<aside class="widgets-structure">
<div class="widgets-structure-inside">
<div class="section-md" data-gtm-element-container="modulo-md" role="complementary">
<div class="section-md-head">
<a class="section-md-head-link" href="http://www.mundodeportivo.com" target="_blank" title="Mundo Deportivo"></a>
</div>
<div class="section-md-content">
<div class="section-md-story" data-gtm-element="container-child" data-vr-contentbox="">
<figure class="story-figure linkable" data-target="_blank">
<img alt="Auger - Nadal: el Masters 1.000 de Madrid, en directo" class="lazy story-image img-responsive" data-gtm-element="container-child-link" data-href="https://www.mundodeportivo.com/tenis/20190508/462069338584/rafa-nadal-auger-masters-madrid-tenis-hoy-directo-online.html" data-src="" data-src-md="https://www.lavanguardia.com/rf/image_small/GODO/MD/p6/ContraPortada/Imagenes/2019/05/06/Recortada/1145276983_20190426194416613-k2R-U462069338584FvH-980x554@MundoDeportivo-Web.jpg" data-src-sm="https://www.lavanguardia.com/rf/image_small/GODO/MD/p6/ContraPortada/Imagenes/2019/05/06/Recortada/1145276983_20190426194416613-k2R-U462069338584FvH-980x554@MundoDeportivo-Web.jpg" data-src-xs="https://www.lavanguardia.com/rf/image_small/GODO/MD/p6/ContraPortada/Imagenes/2019/05/06/Recortada/1145276983_20190426194416613-k2R-U462069338584FvH-980x554@MundoDeportivo-Web.jpg" data-target="_blank" onload="gg.util.setImgSrc(this);" src="https://www.lavanguardia.com/rsc/images/3_1.gif"/></figure>
<div class="section-md-header">
<a class="section-md-header-title-link" data-gtm-element="container-child-link" href="https://www.mundodeportivo.com/tenis/20190508/462069338584/rafa-nadal-auger-masters-madrid-tenis-hoy-directo-online.html" target="_blank" title="Auger - Nadal: el Masters 1.000 de Madrid, en directo">Auger - Nadal: el Masters 1.000 de Madrid, en directo</a>
</div>
</div>
<div class="section-md-story second" data-gtm-element="container-child" data-vr-contentbox="">
<div class="section-md-header">
<a class="section-md-header-title-link" data-gtm-element="container-child-link" href="https://www.mundodeportivo.com/futbol/fc-barcelona/20190508/462125580048/fc-barcelona-barca-champions-shakira-pique.html" target="_blank" title="El mensaje de Shakira tras la debacle de Anfield">El mensaje de Shakira tras la debacle de Anfield</a>
</div>
</div>
</div>
</div>
<div data-gtm-element-container="modulo-hola" data-gtm-element-label="noticia">
<div class="story-hola" data-gtm-element="container-child">
<figure class="story-figure story-figure-hola">
<a class="story-header-title-link" data-gtm-element="container-child-link" href="https://www.hola.com/realeza/casa_inglesa/20190508140862/meghan-markle-principe-harry-presentan-hijo/?utm_source=lavanguardia&utm_medium=referral" rel="follow" target="_blank">
<img class="story-image img-responsive linkable" data-pin-nopin="true" src="https://www.hola.com/imagenes//realeza/casa_inglesa/20190508140862/meghan-markle-principe-harry-presentan-hijo//0-677-408/duques-sussex1-t.jpg?utm_source=lavanguardia&utm_medium=referral"/>
</a>
<img class="story-logo-hola" src="https://www.lavanguardia.com/rsc/images/logo-hola.png"/>
</figure>
<div class="story-bottom">
<div class="story-header">
<span class="story-header-title">
<a class="story-header-title-link" data-gtm-element="container-child-link" href="https://www.hola.com/realeza/casa_inglesa/20190508140862/meghan-markle-principe-harry-presentan-hijo/?utm_source=lavanguardia&utm_medium=referral" rel="follow" target="_blank">Los Duques de Sussex presentan a su primer hijo</a>
</span>
</div>
</div>
</div>
</div></div>
</aside>
</div></div>
<footer class="footer-wrapper text-center">
<div class="container">
<ol class="breadcrumb text-left" itemscope="itemscope" itemtype="https://schema.org/BreadcrumbList">
<li itemprop="itemListElement" itemscope="itemscope" itemtype="https://schema.org/ListItem">
<a href="https://www.lavanguardia.com/economia" itemprop="item">
<span itemprop="name">Economía</span>
</a>
<meta content="1" itemprop="position"/>
</li>
</ol>
<div class="footer-logo">
<a class="footer-logo-link" href="https://www.lavanguardia.com" id="footer-logo-url">
<figure class="footer-logo-figure">
<img alt="La Vanguardia" class="footer-logo-image" data-src="https://www.lavanguardia.com/rsc/images/lv-logo.svg?v=d6d8bbf4d00f1d09d28e8209432d9a7c8d33fccb" onload="gg.util.setImgSrc(this);" src="https://www.lavanguardia.com/rsc/images/3_1.gif"/></figure>
</a>
</div>
<p class="footer-copyright">© La Vanguardia Ediciones Todos los derechos reservados</p>
<ul class="footer-list">
<li class="footer-item"><a class="footer-item-link" href="https://www.lavanguardia.com/quienes-somos" target="_self" title="Quiénes somos">Quiénes somos</a></li>
<li class="footer-item"><a class="footer-item-link" href="https://www.lavanguardia.com/contacto" target="_self" title="Contacto">Contacto</a></li>
<li class="footer-item"><a class="footer-item-link" href="https://www.lavanguardia.com/avisolegal" target="_self" title="Aviso legal">Aviso legal</a></li>
<li class="footer-item"><a class="footer-item-link" href="https://www.lavanguardia.com/ayuda" target="_self" title="Ayuda">Ayuda</a></li>
<li class="footer-item"><a class="footer-item-link" href="https://www.lavanguardia.com/cookies_privacy_LV_popup.html" target="_self" title="Política de cookies">Política de cookies</a></li>
<li class="footer-item"><a class="footer-item-link" href="https://www.lavanguardia.com/otras-webs" target="_self" title="Otras webs">Otras webs</a></li>
<li class="footer-item"><a class="footer-item-link" href="https://www.lavanguardia.com/politica-privacidad" target="_self" title="Política de privacidad">Política de privacidad</a></li>
<li class="footer-item"><a class="footer-item-link" href="javascript:Didomi.preferences.show()" target="_self" title="Área de privacidad">Área de privacidad</a></li>
</ul></div>
</footer>
</body>
</html>
<!-- Generated Wed May 08 09:59:12 CEST 2019 -->
In [ ]:
In [25]:
main_text = soup.find_all('div', 'content-structure')
In [ ]:
In [26]:
text = ''
for elem_text in main_text:
text += elem_text.text
import re
text = re.sub('\s+',' ',text)
text
Out[26]:
' La última edición del informe Doing Business del Banco Mundial deja un margen escaso de alegría para los autónomos españoles. Las jornadas y trámites necesarios para emprender han descendido en los últimos años, pero mantienen a España en un discreto puesto 86 de los 190 países analizados. Eso influye en el dinamismo de la economía nacional, ya que el alrededor del 95% de las empresas que la sustentan tienen menos de nueve trabajadores. Hoy son necesarios 12,5 días y 7 procedimientos para que un negocio eche a andar en territorio español, cifras que pueden parecer excelentes comparadas con las 138 jornadas que había que esperar en 2003. Pero esos datos palidecen frente a las 12 horas que le cuesta a un emprendedor neocelandés empezar a funcionar o el día y medio que tiene que esperar un canadiense. Las jornadas y trámites necesarios para emprender han descendido en los últimos años, pero mantienen a España en un discreto puesto 86 de los 190 países analizados ¿Por qué en España hay que esperar y tramitar más para crear un negocio? La gestora y asesora fiscal Mercedes L. Arcis, de la empresa Soluzzion, considera que la apertura de un local al público es lo que realmente retrasa y complica cualquier proyecto: “Lleva demasiado tiempo y exigencias de distintas administraciones locales a nivel de seguridad, sanidad, accesibilidad”. En la práctica, las normativas nacionales, autonómicas y locales pueden contradecirse y están sometidas a posibles problemas de interpretación. En este sentido, la campaña de Orange ‘Nacidos para ser autónomos’ funciona como altavoz de la realidad de un colectivo que necesita ser escuchado y entendido por la sociedad española. La solución lógica a esta problemática es la creación de una ventanilla única que permita al emprendedor satisfacer todos los requisitos exigidos por distintas capas de la Administración, pero eso requiere una coordinación a menudo inexistente. Por ello el 61,1% de los expertos consultados en el informe Global Entrepeneurship Monitor (GEM) 2017-2018 coinciden en que el exceso de trámites supone la principal dificultad en la creación de empresas en España. Y estas condiciones desaniman a personas interesadas en convertirse en profesionales autónomos. La Confederación Española de la Pequeña y Mediana Empresa (CEPYME) hizo público un documento con propuestas de cara a las elecciones generales de 2019 cuyo argumentario incluía la aplicación del principio “pensar primero en pequeña escala”, que implica mejorar la regulación a todos los niveles para que las pymes puedan crearse con las mínimas trabas administrativas posibles. También apelaba a la instauración de la regla de “una única vez”, para evitar que distintos agentes administrativos pidan a emprendedores información que ya tienen. La Confederación Española de la Pequeña y Mediana Empresa hizo pública su propuesta de mejorar la regulación para que las pymes puedan abrirse con las mínimas trabas administrativas Para que ambos principios puedan aplicarse es imprescindible la mejora en la digitalización de la relación de ciudadanos y empresas con el Estado, algo en lo que España lleva trabajando desde octubre de 2016 con la entrada en vigor de dos leyes específicas. “Internet ha supuesto un avance espectacular, a pesar de que la Administración no está siendo todo lo rápida que sería deseable, sobre todo la Seguridad Social”, apunta la experta de Soluzzion. De hecho, el Observatorio de Competitividad Empresarial de la Cámara de Comercio de España ya indicaba en su edición de 2017 que más del 85% de las pymes, micropymes y autónomos encuestados consideraban probable o muy probable invertir recursos en digitalización, precisamente para mejorar su relación con las instituciones públicas. El objetivo es ahorrar tiempo y dinero a la hora de cumplir con las exigencias administrativas, sin incurrir en riesgo de sanciones. La ley de Reformas urgentes del Trabajo Autónomo aprobada en octubre de 2017 introdujo varias mejoras para los profesionales por cuenta propia, entre ellas la reducción de la carga administrativa de quienes trabajen a la vez para otros y para sí mismos. Como consecuencia, Seguridad Social devuelve ahora de oficio el exceso de cotización por ambos empleos. Hasta la aprobación de esa normativa eran los profesionales en esta situación los que debían solicitarla y demostrar la validez de su petición. La ley de Reformas urgentes del Trabajo Autónomo de 2017 introdujo la reducción de la carga administrativa de quienes trabajen a la vez para otros y para sí mismos Facilitar esa fórmula mixta supone atender mejor a las dinámicas cambiantes de una realidad laboral cada vez más flexible y permitir que cualquier persona pueda poner en marcha proyectos propios. De los más de 3,2 millones de registrados en el Régimen Especial de Trabajadores Autónomos, casi dos millones lo son como persona física y los restantes como societarios. Un entorno amable para el emprendimiento permite que un profesional independiente haga evolucionar su proyecto desde una actividad individual a empezar a generar empleo. De hecho, uno de cada cinco trabajadores que ejerce como autónomo en régimen de persona física tiene al menos a un trabajador a su cargo. Para mejorar estas cifras y seguir combatiendo el desempleo, la reducción de las cargas burocráticas es esencial. '
In [20]:
len(text)
Out[20]:
0
In [38]:
!pip install nltk
Collecting nltk
Requirement already satisfied: six in /home/carlosb/miniconda3/envs/py37/lib/python3.7/site-packages (from nltk) (1.12.0)
Installing collected packages: nltk
Successfully installed nltk-3.4.1
In [39]:
import string
import nltk
nltk.download('stopwords')
[nltk_data] Downloading package stopwords to
[nltk_data] /home/carlosb/nltk_data...
[nltk_data] Unzipping corpora/stopwords.zip.
Out[39]:
True
In [43]:
#Getting Stopwords
import string
nltk.download('stopwords')
from nltk.corpus import stopwords
from nltk.stem.snowball import SnowballStemmer
from nltk.stem.wordnet import WordNetLemmatizer
stop = stopwords.words('spanish')
sno = SnowballStemmer('spanish')
[nltk_data] Downloading package stopwords to
[nltk_data] /home/carlosb/nltk_data...
[nltk_data] Package stopwords is already up-to-date!
In [50]:
def clean_punc(word):
cleaned = re.sub(r'[?|!|\'|#]', r'', word)
cleaned = re.sub(r'[.|,|)|(|\|/]', r' ', cleaned)
return cleaned
In [ ]:
In [48]:
filtered_sentence = []
for word in text.split():
for cleaned_word in clean_punc(word).split():
if (cleaned_word.isalpha() and (len(cleaned_word) > 2) and cleaned_word not in stop):
s = (sno.stem(cleaned_word.lower())).encode('utf8')
filtered_sentence.append(s)
clean_text = b' '.join(filtered_sentence)
In [49]:
clean_text
Out[49]:
b'natali sanchez urib supervivient megh markl beb jueg tron hormiguer janet jumill juici proces miquel icet amor muj masters horoscop horari ajax tottenham inici sesion vanguardi polit minut internacional polit opinion vid deport econom local gent cultur suces tem polit eleccion canal contr natural big vang salud tecnolog television seri muy fan cribe viaj viv motor mod com edicion local madr barcelon cataluny comun valencian andaluc pais vasc ver servici program carteler horoscop lot polit ultim hor hall vid natali sanchez urib jov desaparec par tenis sig direct nadal masters madr direct juici decl votant cit defens polit vanguardi edicion tod derech reserv quien contact avis legal ayud polit cooki otras webs polit privac are privac'
In [ ]:
Content source: carlosb1/examples-python
Similar notebooks: