[ Foro de Python ]

Código para cargar página completa

28-Feb-2023 16:50
Invitado (miguelsat)
1 Respuestas

Hola, habría algún tipo de código para este lenguaje u otro o algún addon para Firefox o Chrome que hiciera que una página web cargase toda de una vez? es decir, normalmente, si es una página de posts, conforme se va desplazando hacia abajo, se van cargando los 5 posts siguentes, si sigo desplazando, tarda unos segunditos en cargar los siguentes 5, así sucesivamente, si hay muchos, tarda una eternidad en cargar y como haya un error de conexión o se quede bloqueado cargando los siguientes posts, hay que empezar de nuevo y así nunca voy a terminar, aparte de eso, quiero copiar todas las urls de los videos incrustados.

Agradecería mucho la ayuda.


15-Mar-2023 00:38
Invitado (Alejandro Andrade)

Sí, existen varias opciones para cargar una página web completa de una sola vez. Una opción es utilizar un software de captura de pantalla web como "Full Page Screen Capture" o "Fireshot" que te permiten capturar toda la página web y guardarla como una imagen o archivo PDF.

Otra opción es utilizar un script de Python con la librería "selenium" que te permite automatizar la navegación en una página web. Con selenium, puedes hacer clic en el botón de "cargar más" o similar para cargar todos los posts en una sola vez. Además, puedes utilizar la librería "BeautifulSoup" para extraer todas las URLs de los videos incrustados.

Aquí te dejo un ejemplo de cómo cargar una página web completa con selenium:

from selenium import webdriver

# Configuramos el driver de Chrome
options = webdriver.ChromeOptions()
options.add_argument('--disable-extensions')
driver = webdriver.Chrome(options=options)

# Abrimos la página web
driver.get('https://www.ejemplo.com')

# Hacemos clic en el botón "Cargar más" hasta que no haya más posts
while True:
   try:
       button = driver.find_element_by_xpath("//button[@class='load-more']")
       button.click()
   except:
       break

# Obtenemos el HTML completo de la página web
html = driver.page_source

# Cerramos el driver
driver.quit()

# Procesamos el HTML con BeautifulSoup para extraer las URLs de los videos incrustados

Ten en cuenta que necesitarás instalar tanto selenium como BeautifulSoup en tu entorno de Python.






(No se puede continuar esta discusión porque tiene más de dos meses de antigüedad. Si tienes dudas parecidas, abre un nuevo hilo.)