java source code of XhamsterRipper

ripme-master
- .github
  - PULL_REQUEST_TEMPLATE.md
  - ISSUE_TEMPLATE.md
  - workflows
    - maven.yml
- src
  - main
    - resources
      - LabelsBundle_es_ES.properties
      - LabelsBundle_porrisavvo_FI.properties
      - LabelsBundle_ru_RU.properties
      - LabelsBundle.properties
      - LabelsBundle_fr_CH.properties
      - log4j.properties
      - icon.ico
      - LabelsBundle_it_IT.properties
      - rip.properties
      - log4j.file.properties
      - LabelsBundle_en_US.properties
      - LabelsBundle_kr_KR.properties
      - LabelsBundle_ar_AR.properties
      - LabelsBundle_pl_PL.properties
      - LabelsBundle_pt_PT.properties
      - camera.wav
      - LabelsBundle_pt_BR.properties
      - LabelsBundle_fi_FI.properties
      - LabelsBundle_nl_NL.properties
      - LabelsBundle_de_DE.properties
      - LabelsBundle_in_ID.properties
    - java
      - com
        rarchives
        ripme
        utils
        Proxy.java
        Base64.java
        Utils.java
        UTF8Control.java
        RipUtils.java
        Http.java
        ripper
        AbstractSingleFileRipper.java
        DownloadFileThread.java
        AlbumRipper.java
        AbstractHTMLRipper.java
        RipperInterface.java
        rippers
        MeituriRipper.java
        DynastyscansRipper.java
        YoupornRipper.java
        TwitterRipper.java
        BatoRipper.java
        ImagefapRipper.java
        ripperhelpers
        ChanSite.java
        ModelmayhemRipper.java
        TumblrRipper.java
        GfycatporntubeRipper.java
        PorncomixDotOneRipper.java
        TwodgalleriesRipper.java
        TeenplanetRipper.java
        HypnohubRipper.java
        RulePornRipper.java
        XlecxRipper.java
        ArtstnRipper.java
        DribbbleRipper.java
        ImagevenueRipper.java
        VkRipper.java
        MastodonXyzRipper.java
        BaraagRipper.java
        MulemaxRipper.java
        EroShareRipper.java
        ArtAlleyRipper.java
        PornpicsRipper.java
        RedditRipper.java
        LusciousRipper.java
        FlickrRipper.java
        PicstatioRipper.java
        FreeComicOnlineRipper.java
        JabArchivesRipper.java
        ThechiveRipper.java
        CheveretoRipper.java
        TapasticRipper.java
        ErofusRipper.java
        XhamsterRipper.java
        MyhentaigalleryRipper.java
        HentaifoundryRipper.java
        InstagramRipper.java
        SpankbangRipper.java
        ImagearnRipper.java
        FivehundredpxRipper.java
        ComicextraRipper.java
        XvideosRipper.java
        BcfakesRipper.java
        HentaiimageRipper.java
        SmuttyRipper.java
        DuckmoviesRipper.java
        WebtoonsRipper.java
        MastodonRipper.java
        PornhubRipper.java
        NfsfwRipper.java
        NhentaiRipper.java
        HentaidudeRipper.java
        NewsfilterRipper.java
        DeviantartRipper.java
        NewgroundsRipper.java
        KingcomixRipper.java
        VidbleRipper.java
        ImgurRipper.java
        ListalRipper.java
        XcartxRipper.java
        HqpornerRipper.java
        TsuminoRipper.java
        GirlsOfDesireRipper.java
        PawooRipper.java
        DrawcrowdRipper.java
        tamindirmp3.java
        Rule34Ripper.java
        Hentai2readRipper.java
        HitomiRipper.java
        PahealRipper.java
        ImagebamRipper.java
        ImgboxRipper.java
        E621Ripper.java
        SinfestRipper.java
        MangadexRipper.java
        AerisdiesRipper.java
        ReadcomicRipper.java
        MyhentaicomicsRipper.java
        StaRipper.java
        VscoRipper.java
        EHentaiRipper.java
        NatalieMuRipper.java
        ViewcomicRipper.java
        ManganeloRipper.java
        ModelxRipper.java
        BooruRipper.java
        PorncomixRipper.java
        ArtStationRipper.java
        PhotobucketRipper.java
        CfakeRipper.java
        AllporncomicRipper.java
        SankakuComplexRipper.java
        FemjoyhunterRipper.java
        HentaiCafeRipper.java
        FitnakedgirlsRipper.java
        EightmusesRipper.java
        PichunterRipper.java
        HbrowseRipper.java
        EromeRipper.java
        JagodibujaRipper.java
        HentaifoxRipper.java
        WordpressComicRipper.java
        NudeGalsRipper.java
        GfycatRipper.java
        DerpiRipper.java
        FolioRipper.java
        ErotivRipper.java
        FuskatorRipper.java
        YuvutuRipper.java
        ShesFreakyRipper.java
        MyreadingmangaRipper.java
        ChanRipper.java
        OglafRipper.java
        SinnercomicsRipper.java
        ZizkiRipper.java
        MotherlessRipper.java
        TheyiffgalleryRipper.java
        video
        ViddmeRipper.java
        VkRipper.java
        TwitchVideoRipper.java
        StickyXXXRipper.java
        CliphunterRipper.java
        PornhubRipper.java
        MotherlessVideoRipper.java
        VidearnRipper.java
        YuvutuRipper.java
        BlackbrickroadofozRipper.java
        FuraffinityRipper.java
        RedgifsRipper.java
        Tubex6Ripper.java
        DownloadVideoThread.java
        AbstractRipper.java
        AbstractJSONRipper.java
        VideoRipper.java
        DownloadThreadPool.java
        ui
        RipStatusComplete.java
        ClipboardUtils.java
        UpdateUtils.java
        QueueMenuMouseListener.java
        MainWindow.java
        HistoryEntry.java
        RipStatusMessage.java
        RipStatusHandler.java
        ContextMenuMouseListener.java
        HistoryMenuMouseListener.java
        History.java
        App.java
  - test
    - java
      - com
        rarchives
        ripme
        tst
        ripper
        rippers
        ErofusRipperTest.java
        VkRipperTest.java
        HentaiimageRipperTest.java
        MulemaxRipperTest.java
        RedditRipperTest.java
        AerisdiesRipperTest.java
        tamindirmp3Test.java
        NewsfilterRipperTest.java
        MastodonRipperTest.java
        ImgboxRipperTest.java
        TapasticRipperTest.java
        RedgifsRipperTest.java
        ListalRipperTest.java
        SinnercomicsRipperTest.java
        SankakuComplexRipperTest.java
        FivehundredpxRipperTest.java
        BcfakesRipperTest.java
        MotherlessRipperTest.java
        MyhentaicomicsRipperTest.java
        FuskatorRipperTest.java
        YoupornRipperTest.java
        MyhentaigalleryRipperTest.java
        ImgurRipperTest.java
        WordpressComicRipperTest.java
        EhentaiRipperTest.java
        PorncomixRipperTest.java
        ChanRipperTest.java
        ImagevenueRipperTest.java
        ImagefapRipperTest.java
        BooruRipperTest.java
        VidbleRipperTest.java
        DrawcrowdRipperTest.java
        MastodonXyzRipperTest.java
        HentaifoundryRipperTest.java
        BaraagRipperTest.java
        GfycatporntubeRipperTest.java
        ArtAlleyRipperTest.java
        NatalieMuRipperTest.java
        EroShareRipperTest.java
        LusciousRipperTest.java
        GfycatRipperTest.java
        VscoRipperTest.java
        NfsfwRipperTest.java
        ArtstnRipperTest.java
        SinfestRipperTest.java
        TheyiffgalleryRipperTest.java
        ModelmayhemRipperTest.java
        KingcomixRipperTest.java
        PawooRipperTest.java
        PornpicsRipperTest.java
        PhotobucketRipperTest.java
        FlickrRipperTest.java
        PahealRipperTest.java
        DuckmoviesRipperTest.java
        HbrowseRipperTest.java
        PornhubRipperTest.java
        NhentaiRipperTest.java
        ErotivRipperTest.java
        Tubex6RipperTest.java
        Rule34RipperTest.java
        ImagearnRipperTest.java
        ViewcomicRipperTest.java
        RulePornRipperTest.java
        CheveretoRipperTest.java
        AllporncomicRipperTest.java
        HentaifoxRipperTest.java
        HypnohubRipperTest.java
        JagodibujaRipperTest.java
        BlackbrickroadofozRipperTest.java
        StaRipperTest.java
        NewgroundsRipperTest.java
        XhamsterRipperTest.java
        FemjoyhunterRipperTest.java
        E621RipperTest.java
        HqpornerRipperTest.java
        VideoRippersTest.java
        HentaicafeRipperTest.java
        YuvutuRipperTest.java
        MangadexRipperTest.java
        PorncomixDotOneRipperTest.java
        BatoRipperTest.java
        HentaidudeRipperTest.java
        DynastyscansRipperTest.java
        StickyXXXRipperTest.java
        ShesFreakyRipperTest.java
        TsuminoRipperTest.java
        JabArchivesRipperTest.java
        OglafRipperTest.java
        ComicextraRipperTest.java
        EightmusesRipperTest.java
        TwitterRipperTest.java
        DeviantartRipperTest.java
        EromeRipperTest.java
        TumblrRipperTest.java
        HitomiRipperTest.java
        ManganeloRipperTest.java
        ArtStationRipperTest.java
        ModelxRipperTest.java
        SmuttyRipperTest.java
        XcartxRipperTest.java
        MyreadingmangaRipperTest.java
        XvideosRipperTest.java
        SpankBangRipperTest.java
        ImagebamRipperTest.java
        WebtoonsRipperTest.java
        XlecxRipperTest.java
        ZizkiRipperTest.java
        TwodgalleriesRipperTest.java
        ThechiveRipperTest.java
        InstagramRipperTest.java
        RippersTest.java
        FuraffinityRipperTest.java
        PichunterRipperTest.java
        DribbbleRipperTest.java
        CfakeRipperTest.java
        PicstatioRipperTest.java
        Hentai2readRipperTest.java
        MeituriRipperTest.java
        NudeGalsRipperTest.java
        FolioRipperTest.java
        GirlsOfDesireRipperTest.java
        TeenplanetRipperTest.java
        ui
        LabelsBundlesTest.java
        RipStatusMessageTest.java
        proxyTest.java
        Base64Test.java
        UtilsTest.java
        AppTest.java
        AbstractRipperTest.java
  - LabelsBundle_zh_CN.properties
- utils
  - style.sh
  - stylefix.sh
- pom.xml
- release.py
- deploy.ps1
- deploy.bat
- patch.py
- CONTRIBUTING.md
- build.bat
- SECURITY.md
- workspace.code-workspace
- .travis.yml
- README.md
- .gitignore
- LICENSE.txt
- build.sh
- ripme.json
- .project
- .vscode
  - settings.json

package com.rarchives.ripme.ripper.rippers;

import java.io.IOException;
import java.net.MalformedURLException;
import java.net.URL;
import java.util.ArrayList;
import java.util.List;
import java.util.regex.Matcher;
import java.util.regex.Pattern;

import org.jsoup.nodes.Document;
import org.jsoup.nodes.Element;

import com.rarchives.ripme.ripper.AbstractHTMLRipper;
import com.rarchives.ripme.utils.Http;


// WARNING
// This ripper changes all requests to use the MOBILE version of the site
// If you're changing anything be sure to use the mobile sites html/css or you're just wasting your time!
// WARNING

public class XhamsterRipper extends AbstractHTMLRipper {

    public XhamsterRipper(URL url) throws IOException {
        super(url);
    }

    private int index = 1;

    @Override public boolean hasASAPRipping() {
        return true;
    }

    @Override
    public String getHost() {
        return "xhamster";
    }

    @Override
    public String getDomain() {
        return "xhamster.com";
    }

    @Override
    public URL sanitizeURL(URL url) throws MalformedURLException {
        if (isVideoUrl(url)) {
            return url;
        }
        String URLToReturn = url.toExternalForm();
        URLToReturn = URLToReturn.replaceAll("https?://\\w?\\w?\\.?xhamster\\.", "https://m.xhamster.");
        URLToReturn = URLToReturn.replaceAll("https?://xhamster2\\.", "https://m.xhamster2.");
        URL san_url = new URL(URLToReturn);
        LOGGER.info("sanitized URL is " + san_url.toExternalForm());
        return san_url;
    }

    @Override
    public String getGID(URL url) throws MalformedURLException {
        Pattern p = Pattern.compile("^https?://[\\w\\w.]*xhamster2?\\.com/photos/gallery/.*?(\\d+)$");
        Matcher m = p.matcher(url.toExternalForm());
        if (m.matches()) {
            return m.group(1);
        }
        p = Pattern.compile("^https?://[\\w\\w.]*xhamster2?\\.com/users/([a-zA-Z0-9_-]+)/(photos|videos)(/\\d+)?");
        m = p.matcher(url.toExternalForm());
        if (m.matches()) {
            return "user_" + m.group(1);
        }
        p = Pattern.compile("^https?://.*xhamster2?\\.com/(movies|videos)/(.*)$");
        m = p.matcher(url.toExternalForm());
        if (m.matches()) {
            return m.group(2);
        }

            throw new MalformedURLException(
                "Expected xhamster.com gallery formats: "
                        + "xhamster.com/photos/gallery/xxxxx-#####"
                        + " Got: " + url);
    }

    @Override
    public List<String> getAlbumsToQueue(Document doc) {
        List<String> urlsToAddToQueue = new ArrayList<>();
        LOGGER.info("getting albums");
        for (Element elem : doc.select("div.item-container > a.item")) {
            urlsToAddToQueue.add(elem.attr("href"));
        }
        LOGGER.info(doc.html());
        return urlsToAddToQueue;
    }

    @Override
    public boolean hasQueueSupport() {
        return true;
    }

    @Override
    public boolean pageContainsAlbums(URL url) {
        Pattern p = Pattern.compile("^https?://[\\w\\w.]*xhamster\\.com/users/([a-zA-Z0-9_-]+)/(photos|videos)(/\\d+)?");
        Matcher m = p.matcher(url.toExternalForm());
        LOGGER.info("Checking if page has albums");
        LOGGER.info(m.matches());
        return m.matches();
    }


    @Override
    public Document getFirstPage() throws IOException {
        // "url" is an instance field of the superclass
        return Http.url(url).get();
    }

    @Override
    public boolean canRip(URL url) {
        Pattern p = Pattern.compile("^https?://([\\w\\w]*\\.)?xhamster2?\\.(com|one|desi)/photos/gallery/.*?(\\d+)$");
        Matcher m = p.matcher(url.toExternalForm());
        if (m.matches()) {
            return true;
        }
        p = Pattern.compile("^https?://[\\w\\w.]*xhamster2?\\.(com|one|desi)/users/([a-zA-Z0-9_-]+)/(photos|videos)(/\\d+)?");
        m = p.matcher(url.toExternalForm());
        if (m.matches()) {
            return true;
        }
        p = Pattern.compile("^https?://.*xhamster2?\\.(com|one|desi)/(movies|videos)/.*$");
        m = p.matcher(url.toExternalForm());
        if (m.matches()) {
            return true;
        }
        return false;
    }

    private boolean isVideoUrl(URL url) {
        Pattern p = Pattern.compile("^https?://.*xhamster2?\\.(com|one|desi)/(movies|videos)/.*$");
        Matcher m = p.matcher(url.toExternalForm());
        return m.matches();
    }

    @Override
    public Document getNextPage(Document doc) throws IOException {
        if (doc.select("a[data-page=next]").first() != null) {
            String nextPageUrl = doc.select("a[data-page=next]").first().attr("href");
            if (nextPageUrl.startsWith("http")) {
                nextPageUrl = nextPageUrl.replaceAll("https?://\\w?\\w?\\.?xhamster\\.", "https://m.xhamster.");
                nextPageUrl = nextPageUrl.replaceAll("https?://xhamster2\\.", "https://m.xhamster2.");
                return Http.url(nextPageUrl).get();
            }
        }
        throw new IOException("No more pages");

    }

    @Override
    public List<String> getURLsFromPage(Document doc) {
        LOGGER.debug("Checking for urls");
        List<String> result = new ArrayList<>();
        if (!isVideoUrl(url)) {
          for (Element page : doc.select("div.picture_view > div.pictures_block > div.items > div.item-container > a.item")) {
              // Make sure we don't waste time running the loop if the ripper has been stopped
              if (isStopped()) {
                  break;
              }
              String pageWithImageUrl = page.attr("href");
              try {
                  // This works around some redirect fuckery xhamster likes to do where visiting m.xhamster.com sends to
                  // the page chamster.com but displays the mobile site from m.xhamster.com
                  pageWithImageUrl = pageWithImageUrl.replaceAll("://xhamster\\.", "://m.xhamster.");
                  pageWithImageUrl = pageWithImageUrl.replaceAll("://xhamster2\\.", "://m.xhamster.");
                  String image = Http.url(new URL(pageWithImageUrl)).get().select("a > img#photoCurr").attr("src");
                  downloadFile(image);
              } catch (IOException e) {
                  LOGGER.error("Was unable to load page " + pageWithImageUrl);
              }
          }
        } else {
            String imgUrl = doc.select("div.player-container > a").attr("href");
            downloadFile(imgUrl);
        }
        return result;
    }

    @Override
    public void downloadURL(URL url, int index) {
        addURLToDownload(url, getPrefix(index));
    }

    private void downloadFile(String url) {
        try {
            addURLToDownload(new URL(url), getPrefix(index));
            index = index + 1;
        } catch (MalformedURLException e) {
            LOGGER.error("The url \"" + url + "\" is malformed");
        }
    }
    
    @Override
    public String getAlbumTitle(URL url) throws MalformedURLException {
        try {
            // Attempt to use album title and username as GID
            Document doc = getFirstPage();
            Element user = doc.select("a.author").first();
            String username = user.text();
            String path = url.getPath();
            Pattern p = Pattern.compile("^/photos/gallery/(.*)$");
            Matcher m = p.matcher(path);
            if (m.matches() && !username.isEmpty()) {
                return getHost() + "_" + username + "_" + m.group(1);
            }
        } catch (IOException | NullPointerException e) {
            // Fall back to default album naming convention
        }
        return super.getAlbumTitle(url);
    }
}