Получить HTML содержимое веб-страницы с помощью Python
Python предоставляет несколько способов сделать это в своей стандартной библиотеке . Вероятно, самый популярный способ загрузки файла - через HTTP с помощью модуля urllib . Метод urllib.request - это модуль Python для извлечения URL-адресов. Он предлагает очень простой интерфейс в виде функции urlopen. Это позволяет получать URL-адреса с использованием различных протоколов. urllib.request.urlopen() , откройте URL-адрес URL, который может быть строкой или объектом Request.
Пример:
from urllib.request import urlopen html = urlopen("http://net-informations.com/about.htm") print(html.read())