小林 由快
東京都 大田区 西蒲田6丁目32-11 城南信用金庫蓮沼支店3階J-Create+ROOM-J
  • 自社で営業支援エージェントを運営するAI開発会社
  • AIペアプロ開発で圧倒的スピード納品
  • 大手SIer品質 x 北大クロスドメインチーム

「全国100から200サイトを2年以上日次巡回中」大規模スクレイピング・Webデータ収集基盤構築

Scrapy・Scrapydによる大規模スクレイピング基盤の構築から、GitHub Actionsによる日次バッチ自動化、正規化とマッチング処理まで一貫してご提供します。

「対応可能な内容」
・Scrapy/Scrapyd/Playwrightによるスクレイパー開発
・複数サイト横断の収集基盤構築
・日次/時間次の自動実行バッチ構築(GitHub Actions/cron)
・取得データの正規化・重複排除・マッチング処理
・エラー検知・自動リトライ・アラート通知
・robots.txt・利用規約チェック込みの運用設計
・既存スクレイパーのメンテナンス・改修・高速化

「長期運用のノウハウ」
建設業向けAI営業支援エージェントで、全国100から200自治体を2年以上毎日巡回し続けている実績があります。アンチBot対策、サイトリニューアル時の高速改修、Wave方式での負荷分散、同一サイトへの同時アクセス回避など、長期運用で初めて分かるノウハウを活かした安定運用を設計します。

会社特色
実績が豊富技術力重視ノウハウが充実
会社規模「社員数.(人)」
4 人
得意業界
建設業情報通信業サービス業
得意業務
小規模LAN中規模LAN大規模LAN
対応業務
ネットワーク設計ネットワーク構築移行ネットワーク・システムの運用支援
実績
・全国100から200自治体の入札情報サイトを日次巡回(GIRAFFE)
2年以上の継続運用/19000件超のデータを本番DBに蓄積/Wave方式(サイトグループ別並列実行)で負荷分散/除外ルール6種による類似案件の誤マッチ抑制/同一サイトへの同時アクセス回避など運用マナー遵守
・取得データから正規化・AI自動マッチングまでの一気通貫パイプラインを本番稼働中
特徴
スクレイピングは「作る」より「運用し続ける」方が10倍難しいと考えています。弊社は自社プロダクトで2年以上の大規模継続運用をしており、サイトリニューアル時の緊急対応、アンチBot対策、失敗検知、収集データの正規化・重複排除まで、実運用で磨かれたノウハウを持っています。GitHub Actionsでサーバーレスな低コスト運用を実現できるのも強みです。
備考
・ 単発スクレイパー開発から継続運用基盤まで対応可能です。
・ 運用保守プラン(月額固定)もご用意できます。
・ robots.txt・利用規約のチェックを行った上でご提案いたします。

対応地域

実績・事例

SI・ネットワーク構築の料金相場

SI・ネットワーク構築の相場

メニュー

株式会社サファリテックへお問い合わせ
株式会社サファリテック

会社情報

会社名
株式会社サファリテック
業種
IT:システム開発
代表者名
小林 由快
郵便番号
144-0051
所在地
東京都大田区西蒲田6丁目32-11 城南信用金庫蓮沼支店3階J-Create+ROOM-J