<?xml version="1.0" encoding="utf-8" standalone="yes"?>
<rss version="2.0" xmlns:atom="http://www.w3.org/2005/Atom">
  <channel>
    <title>Web Scraping on 技术杂烩</title>
    <link>https://blog.iamdev.cn/tags/Web-scraping/</link>
    <description>Recent content in Web Scraping on 技术杂烩</description>
    <generator>Hugo</generator>
    <language>zh-CN</language>
    <lastBuildDate>Sun, 14 Jul 2024 18:05:16 +0800</lastBuildDate>
    <atom:link href="https://blog.iamdev.cn/tags/Web-scraping/index.xml" rel="self" type="application/rss+xml" />
    <item>
      <title>Crawlee: 一款强大易用的爬虫和浏览器自动化库</title>
      <link>https://blog.iamdev.cn/post/2024/Crawlee__%E4%B8%80%E6%AC%BE%E5%BC%BA%E5%A4%A7%E6%98%93%E7%94%A8%E7%9A%84%E7%88%AC%E8%99%AB%E5%92%8C%E6%B5%8F%E8%A7%88%E5%99%A8%E8%87%AA%E5%8A%A8%E5%8C%96%E5%BA%93__/</link>
      <pubDate>Sun, 14 Jul 2024 18:05:16 +0800</pubDate>
      <guid>https://blog.iamdev.cn/post/2024/Crawlee__%E4%B8%80%E6%AC%BE%E5%BC%BA%E5%A4%A7%E6%98%93%E7%94%A8%E7%9A%84%E7%88%AC%E8%99%AB%E5%92%8C%E6%B5%8F%E8%A7%88%E5%99%A8%E8%87%AA%E5%8A%A8%E5%8C%96%E5%BA%93__/</guid>
      <description>&lt;h2 id=&#34;crawlee一款强大而易用的爬虫和浏览器自动化库&#34;&gt;Crawlee：一款强大而易用的爬虫和浏览器自动化库&lt;/h2&gt;&#xA;&lt;p&gt;&lt;a href=&#34;https://github.com/apify/crawlee-python&#34;&gt;https://github.com/apify/crawlee-python&lt;/a&gt;&#xA;在当今数据驱动的时代，从网络上提取信息的需求越来越迫切。Crawlee 应运而生，作为一款功能强大的爬虫和浏览器自动化库，它能够帮助你快速构建可靠的爬虫，实现无缝的端到端爬取和抓取数据。🚀&lt;/p&gt;&#xA;&lt;p&gt;&lt;strong&gt;Human-like Crawling：规避机器人检测&lt;/strong&gt;&lt;/p&gt;&#xA;&lt;p&gt;利用Crawlee，你的爬虫会展现出近乎人类般的行为模式，即使使用默认配置，也能轻松躲过现代机器人的反爬机制。&lt;/p&gt;</description>
    </item>
    <item>
      <title>ScrapeGraphAI：用一句话搞定网页爬取</title>
      <link>https://blog.iamdev.cn/post/2024/ScrapeGraphAI_%E7%94%A8%E4%B8%80%E5%8F%A5%E8%AF%9D%E6%90%9E%E5%AE%9A%E7%BD%91%E9%A1%B5%E7%88%AC%E5%8F%96__/</link>
      <pubDate>Fri, 12 Jul 2024 11:30:08 +0800</pubDate>
      <guid>https://blog.iamdev.cn/post/2024/ScrapeGraphAI_%E7%94%A8%E4%B8%80%E5%8F%A5%E8%AF%9D%E6%90%9E%E5%AE%9A%E7%BD%91%E9%A1%B5%E7%88%AC%E5%8F%96__/</guid>
      <description>&lt;h2 id=&#34;用一句话搞定网页爬取scrapegraphai-让你轻松实现&#34;&gt;用一句话搞定网页爬取？ScrapeGraphAI 让你轻松实现！&lt;/h2&gt;&#xA;&lt;p&gt;今天给大家介绍一个神器——ScrapeGraphAI，它可以帮你轻松实现网页爬取！&lt;/p&gt;&#xA;&lt;p&gt;&lt;a href=&#34;https://github.com/ScrapeGraphAI/Scrapegraph-ai&#34;&gt;https://github.com/ScrapeGraphAI/Scrapegraph-ai&lt;/a&gt;&#xA;你是否曾经苦恼于手动编写爬取脚本，还要应对各种网页结构变化？ScrapeGraphAI 彻底解决了这些问题！它利用大型语言模型 (LLM) 和直接图谱逻辑，只需你一句话描述要提取的信息，它就能帮你完成！&lt;/p&gt;</description>
    </item>
  </channel>
</rss>
