Bu proje, Go (Golang) ile geliştirilmiş, belirlenen web sitelerinden veri çeken, ekran görüntüsü alan ve linkleri raporlayan güçlü ve hızlı bir araçtır. chromedp kütüphanesini kullanarak gerçek bir tarayıcı (headless) üzerinden işlem yapar.
- HTML İndirme: Hedef sayfanın ham HTML içeriğini kaydeder.
- Ekran Görüntüsü: Sayfanın tam boy ekran görüntüsünü (screenshot) alır.
- URL Çıkarma: Sayfadaki tüm linkleri ayıklar ve listeler.
- Eş Zamanlı Tarama: Birden fazla siteyi aynı anda (concurrent) tarayabilir.
- Otomatik Klasörleme: Çıktıları
html,screenshotsveurlklasörlerine düzenli bir şekilde kaydeder. - Tarayıcı Desteği: Google Chrome ve Brave Browser ile uyumludur.
- Go (Golang) yüklü olmalıdır.
- Google Chrome veya Brave Browser yüklü olmalıdır.
Projeyi bilgisayarınıza indirdikten sonra, gerekli kütüphaneleri yüklemek için terminalde şu komutları çalıştırın:
# Bağımlılıkları yükle ve güncelle (Önemli: Hataları önlemek için lates sürüm kullanılmalı)
go get -u github.com/chromedp/chromedp@latest github.com/chromedp/cdproto@latest
go mod tidyProgramı terminal veya komut satırı üzerinden çalıştırabilirsiniz.
go run scrapper.go -url="https://www.google.com"Birden fazla URL'yi virgülle ayırarak yazabilirsiniz. Program bunları eş zamanlı olarak tarayacaktır.
go run scrapper.go -url="https://www.google.com,https://github.com,https://haberler.com"Eğer sisteminizde Chrome yerine Brave yüklü ise -brave parametresini ekleyin:
go run scrapper.go -url="https://www.google.com" -braveTarayıcınız standart dışı bir klasörde yüklü ise yolunu (path) belirtebilirsiniz:
go run scrapper.go -url="https://www.google.com" -exec-path="C:\Program Files\Tarayici\tarayici.exe"Program çalıştıktan sonra proje klasöründe şu dizinler oluşur:
- 📂 html/: Sitelerin
.htmldosyaları burada saklanır. - 📂 screenshots/: Sitelerin
.pngformatındaki ekran görüntüleri buradadır. - 📂 url/: Her siteden çıkarılan linklerin olduğu
.txtdosyaları buradadır.
Dosya isimleri taranan sitenin adına göre otomatik oluşturulur (örn: google.com_screenshot.png).
Bu proje açık kaynaklıdır ve eğitim amaçlı hazırlanmıştır.