Nach sagen wir mal 10 Tagen hast du eine schöne Liste mit allen IPs bzw. Ip-Ranges und UAs über die der Bot kommt.
Jetzt noch einen Filter schreiben der beim Aufruf einer Seite zuerst abgearbeitet wird. Was du dem dann auslieferst bleibt deiner Fantasie überlassen. Auf keinen Fall würde ich dem aber einen 403 mitgeben. Wer tarnt und täuscht der wird ebenfalls getäuscht.

Ich hab mehrere tausend Zugriffe aufgezeichnet und analysiert. Kollateralschaden praktisch 0. Man könnte noch ein Captcha und Cookie setzten mit dem ein echter Besucher das Filterscript deaktivieren kann.