Web_scraping_project/main.py

from scraping_engine import FingerprintScrapingEngine
from scraper import CryptoJobScraper  # Updated class name
import os
from dotenv import load_dotenv
import asyncio
import random
import time

load_dotenv()


async def main():
    engine = FingerprintScrapingEngine(
        seed="crypto_scraping_12",
        target_os="windows",
        db_path="crypto_jobs.db",
        markdown_path="crypto_jobs.md"
    )

    scraper = CryptoJobScraper(engine, human_speed=1.3, user_request="Extract title, company, location, description, requirements, qualifications, nature of work, and salary")

    job_titles = [
        "Blockchain Engineer",
        "Smart Contract Developer",
        "DeFi Analyst",
        "Web3 Developer",
        "Crypto Researcher",
        "Solidity Developer",
        "Protocol Engineer",
        "Tokenomics Specialist",
        "Zero-Knowledge Proof Engineer",
        "Crypto Compliance Officer"
    ]

    while True:
        random.shuffle(job_titles)
        for job_title in job_titles:
            search_keywords = job_title  # No location param needed

            print(f"\n{'='*60}")
            print(f"Starting scrape for: {search_keywords}")
            print(f"{'='*60}")

            await scraper.scrape_jobs(search_keywords=search_keywords)

            print(f"\n✅ Completed scraping for: {job_title}")
            print(f"⏳ Waiting 90 seconds before next job title...")
            time.sleep(90)

        print(f"\n✅ Completed full cycle")
        print(f"🔄 Starting new cycle...")

if __name__ == "__main__":
    asyncio.run(main())