basta-server/ofu-food/mensa-page-parser.py

import requests
from bs4 import BeautifulSoup
import json


def loadPage(url: str):
    return requests.get(url).content


def getMenuDay(soup):
    return soup.find("div", {"class": "day"}).h5.contents[0]


def getFoodPerDay(soup):
    days = []
    for day in soup.select('.currentweek .day'):
        dayObj = {}
        daysoup = BeautifulSoup(str(day), "lxml")
        day = getMenuDay(daysoup)
        dayMenu = [e.getText() for e in daysoup.select('.menuwrap .menu .left .title')]

        dayObj['date'] = day
        dayObj['menu'] = dayMenu
        days.append(dayObj)
    return days


def parsePage(url: str):
    pagecontent = {}
    # {mensaspeiseplan:
    #   {name:"",
    #    weekmenu: [day:{date:, menu:[,,,]}]
    #   }
    # }
    mensaSpeiseplan = {}
    page = loadPage(url)
    soup = BeautifulSoup(page, "lxml")
    foodplan_name = getFoodplanName(soup)
    days = getFoodPerDay(soup)
    mensaSpeiseplan['weekmenu'] = days
    mensaSpeiseplan['name'] = foodplan_name
    mensaSpeiseplanJson = json.dumps(mensaSpeiseplan)
    return mensaSpeiseplanJson


def getFoodplanName(soup):
    foodplan_name = soup.select('.mensamenu h2')[0].getText()
    return foodplan_name