Question reponse

  • Auteur de la discussion John
  • Date de début
J
John
Anonyme
# Importation de packages
from bs4 import BeautifulSoup
import urllib.request
import pandas as pd

url='https://elpais.com/sociedad/2022-05-03/el-supremo-de-estados-unidos-se-dispone-a-derogar-el-derecho-al-aborto.html'

soup = BeautifulSoup(urllib.request.urlopen(url, timeout=10),'html.parser')
print(soup)

# Recuperation de la date
date=soup.find("a",{"id":"article_date_p"})
date=date.get("data-date")
print(date)

# Recuperation d'un texte
titre=soup.find("h1",{"class":"a_t"})
titre=titre.get_text()
print(titre)

# Recuperation du texte de l'article
texte=soup.find("div",{"class":"a_c clearfix"})
texte=texte.get_text()
print(texte)

# Traduire le titre en anglais
pip install googletrans==3.1.0a0
from googletrans import Translator

translator = Translator()

translated_text = translator.translate(titre)
print(translated_text.text)

# Exporter ces 4 éléments dans un fichier excel dans 4 colonnes différentes comportant les titres correspondants.
data=pd.DataFrame([[date,titre,texte,translated_text]],columns=['date','titre','texte','translated_text'])
print(data)
data.to_excel("webscraping.xlsx",sheet_name='webscrap')

Pourquoi ma traduction ne marche pas ?
 
Un forum engagé, des associations renforcées
Faites des dons grace à vos Fofocoins !
Les associations du moment