Sat, 24 Jun 2017 19:38:05 +0300
Lisää päivityksiä
0 | 1 | #!/usr/bin/env python3 |
2 | 2 | import enum, json |
3 | from sys import stderr | |
0 | 4 | from datetime import date, time, datetime, timedelta |
5 | 5 | from copy import copy |
2 | 6 | from misc import * |
7
f3791dccfd03
Käännetty tiedostojen nimet englanniksi
Teemu Piippo <teemu@hecknology.net>
parents:
5
diff
changeset
|
7 | from geometry import * |
0 | 8 | |
24
e6bdb9c54096
Yhtenäistetty ohjelmakoodin kieli englanniksi
Teemu Piippo <teemu@hecknology.net>
parents:
23
diff
changeset
|
9 | def transform_trip_reference(reference): |
e6bdb9c54096
Yhtenäistetty ohjelmakoodin kieli englanniksi
Teemu Piippo <teemu@hecknology.net>
parents:
23
diff
changeset
|
10 | return reference |
0 | 11 | |
24
e6bdb9c54096
Yhtenäistetty ohjelmakoodin kieli englanniksi
Teemu Piippo <teemu@hecknology.net>
parents:
23
diff
changeset
|
12 | class BusTrip: |
e6bdb9c54096
Yhtenäistetty ohjelmakoodin kieli englanniksi
Teemu Piippo <teemu@hecknology.net>
parents:
23
diff
changeset
|
13 | def __init__(self, reference, route, service, length): |
e6bdb9c54096
Yhtenäistetty ohjelmakoodin kieli englanniksi
Teemu Piippo <teemu@hecknology.net>
parents:
23
diff
changeset
|
14 | self.reference, self.route, self.service = reference, route, service |
22 | 15 | self.length = length |
24
e6bdb9c54096
Yhtenäistetty ohjelmakoodin kieli englanniksi
Teemu Piippo <teemu@hecknology.net>
parents:
23
diff
changeset
|
16 | self.schedule = [] |
e6bdb9c54096
Yhtenäistetty ohjelmakoodin kieli englanniksi
Teemu Piippo <teemu@hecknology.net>
parents:
23
diff
changeset
|
17 | self.name = transform_trip_reference(reference) |
0 | 18 | def __repr__(self): |
24
e6bdb9c54096
Yhtenäistetty ohjelmakoodin kieli englanniksi
Teemu Piippo <teemu@hecknology.net>
parents:
23
diff
changeset
|
19 | return 'all_trips[%r]' % self.name |
e6bdb9c54096
Yhtenäistetty ohjelmakoodin kieli englanniksi
Teemu Piippo <teemu@hecknology.net>
parents:
23
diff
changeset
|
20 | def contains_stop(self, stop): |
e6bdb9c54096
Yhtenäistetty ohjelmakoodin kieli englanniksi
Teemu Piippo <teemu@hecknology.net>
parents:
23
diff
changeset
|
21 | for halt in self.schedule: |
e6bdb9c54096
Yhtenäistetty ohjelmakoodin kieli englanniksi
Teemu Piippo <teemu@hecknology.net>
parents:
23
diff
changeset
|
22 | if halt.stop is stop: |
e6bdb9c54096
Yhtenäistetty ohjelmakoodin kieli englanniksi
Teemu Piippo <teemu@hecknology.net>
parents:
23
diff
changeset
|
23 | return halt |
0 | 24 | else: |
25 | return None | |
24
e6bdb9c54096
Yhtenäistetty ohjelmakoodin kieli englanniksi
Teemu Piippo <teemu@hecknology.net>
parents:
23
diff
changeset
|
26 | def is_served_at(self, day): |
0 | 27 | try: |
24
e6bdb9c54096
Yhtenäistetty ohjelmakoodin kieli englanniksi
Teemu Piippo <teemu@hecknology.net>
parents:
23
diff
changeset
|
28 | return self.service in services_for_day[day] |
0 | 29 | except KeyError: |
30 | return False | |
24
e6bdb9c54096
Yhtenäistetty ohjelmakoodin kieli englanniksi
Teemu Piippo <teemu@hecknology.net>
parents:
23
diff
changeset
|
31 | def concise_schedule(self, starting_stop = None): |
e6bdb9c54096
Yhtenäistetty ohjelmakoodin kieli englanniksi
Teemu Piippo <teemu@hecknology.net>
parents:
23
diff
changeset
|
32 | if starting_stop and starting_stop in self.schedule: |
e6bdb9c54096
Yhtenäistetty ohjelmakoodin kieli englanniksi
Teemu Piippo <teemu@hecknology.net>
parents:
23
diff
changeset
|
33 | schedule = copy(self.schedule) |
e6bdb9c54096
Yhtenäistetty ohjelmakoodin kieli englanniksi
Teemu Piippo <teemu@hecknology.net>
parents:
23
diff
changeset
|
34 | schedule = schedule[schedule.index(starting_stop):] |
5 | 35 | else: |
24
e6bdb9c54096
Yhtenäistetty ohjelmakoodin kieli englanniksi
Teemu Piippo <teemu@hecknology.net>
parents:
23
diff
changeset
|
36 | schedule = self.schedule |
e6bdb9c54096
Yhtenäistetty ohjelmakoodin kieli englanniksi
Teemu Piippo <teemu@hecknology.net>
parents:
23
diff
changeset
|
37 | used_areas = set() |
e6bdb9c54096
Yhtenäistetty ohjelmakoodin kieli englanniksi
Teemu Piippo <teemu@hecknology.net>
parents:
23
diff
changeset
|
38 | result = [] |
e6bdb9c54096
Yhtenäistetty ohjelmakoodin kieli englanniksi
Teemu Piippo <teemu@hecknology.net>
parents:
23
diff
changeset
|
39 | for halt in schedule: |
e6bdb9c54096
Yhtenäistetty ohjelmakoodin kieli englanniksi
Teemu Piippo <teemu@hecknology.net>
parents:
23
diff
changeset
|
40 | stop = halt.stop |
e6bdb9c54096
Yhtenäistetty ohjelmakoodin kieli englanniksi
Teemu Piippo <teemu@hecknology.net>
parents:
23
diff
changeset
|
41 | if stop.region and stop.region not in used_areas: |
e6bdb9c54096
Yhtenäistetty ohjelmakoodin kieli englanniksi
Teemu Piippo <teemu@hecknology.net>
parents:
23
diff
changeset
|
42 | used_areas.add(stop.region) |
e6bdb9c54096
Yhtenäistetty ohjelmakoodin kieli englanniksi
Teemu Piippo <teemu@hecknology.net>
parents:
23
diff
changeset
|
43 | result.append(stop.region) |
e6bdb9c54096
Yhtenäistetty ohjelmakoodin kieli englanniksi
Teemu Piippo <teemu@hecknology.net>
parents:
23
diff
changeset
|
44 | return result |
0 | 45 | |
24
e6bdb9c54096
Yhtenäistetty ohjelmakoodin kieli englanniksi
Teemu Piippo <teemu@hecknology.net>
parents:
23
diff
changeset
|
46 | class BusRoute: |
e6bdb9c54096
Yhtenäistetty ohjelmakoodin kieli englanniksi
Teemu Piippo <teemu@hecknology.net>
parents:
23
diff
changeset
|
47 | def __init__(self, entry): |
e6bdb9c54096
Yhtenäistetty ohjelmakoodin kieli englanniksi
Teemu Piippo <teemu@hecknology.net>
parents:
23
diff
changeset
|
48 | self.id = entry['route_id'] |
e6bdb9c54096
Yhtenäistetty ohjelmakoodin kieli englanniksi
Teemu Piippo <teemu@hecknology.net>
parents:
23
diff
changeset
|
49 | self.reference = entry['route_short_name'] |
28
670ffa424ded
Bussipysäkit tallentavat ajovuoronsa välimuistiin suoritusajan nopeuttamiseksi
Teemu Piippo <teemu@hecknology.net>
parents:
26
diff
changeset
|
50 | self.trips = set() |
0 | 51 | def __repr__(self): |
24
e6bdb9c54096
Yhtenäistetty ohjelmakoodin kieli englanniksi
Teemu Piippo <teemu@hecknology.net>
parents:
23
diff
changeset
|
52 | return 'routes[%r]' % self.reference |
0 | 53 | |
24
e6bdb9c54096
Yhtenäistetty ohjelmakoodin kieli englanniksi
Teemu Piippo <teemu@hecknology.net>
parents:
23
diff
changeset
|
54 | class BusService: |
e6bdb9c54096
Yhtenäistetty ohjelmakoodin kieli englanniksi
Teemu Piippo <teemu@hecknology.net>
parents:
23
diff
changeset
|
55 | def __init__(self, reference): |
e6bdb9c54096
Yhtenäistetty ohjelmakoodin kieli englanniksi
Teemu Piippo <teemu@hecknology.net>
parents:
23
diff
changeset
|
56 | self.reference = reference |
e6bdb9c54096
Yhtenäistetty ohjelmakoodin kieli englanniksi
Teemu Piippo <teemu@hecknology.net>
parents:
23
diff
changeset
|
57 | self.dates = set() |
0 | 58 | def __repr__(self): |
24
e6bdb9c54096
Yhtenäistetty ohjelmakoodin kieli englanniksi
Teemu Piippo <teemu@hecknology.net>
parents:
23
diff
changeset
|
59 | return 'services[%r]' % self.reference |
0 | 60 | |
24
e6bdb9c54096
Yhtenäistetty ohjelmakoodin kieli englanniksi
Teemu Piippo <teemu@hecknology.net>
parents:
23
diff
changeset
|
61 | class BusStop: |
29 | 62 | def __init__(self, reference, name, location, code = None): |
24
e6bdb9c54096
Yhtenäistetty ohjelmakoodin kieli englanniksi
Teemu Piippo <teemu@hecknology.net>
parents:
23
diff
changeset
|
63 | self.reference, self.name, self.location = reference, name, location |
29 | 64 | self.code = code or reference |
15
a22cdf28930f
Lisätty bussipysäkkien ryhmittely
Teemu Piippo <teemu@hecknology.net>
parents:
7
diff
changeset
|
65 | self.cluster = None |
a22cdf28930f
Lisätty bussipysäkkien ryhmittely
Teemu Piippo <teemu@hecknology.net>
parents:
7
diff
changeset
|
66 | self.pairs = set() # samannimiset lähellä olevat pysäkit |
28
670ffa424ded
Bussipysäkit tallentavat ajovuoronsa välimuistiin suoritusajan nopeuttamiseksi
Teemu Piippo <teemu@hecknology.net>
parents:
26
diff
changeset
|
67 | self.involved_trips = set() |
0 | 68 | def __repr__(self): |
24
e6bdb9c54096
Yhtenäistetty ohjelmakoodin kieli englanniksi
Teemu Piippo <teemu@hecknology.net>
parents:
23
diff
changeset
|
69 | return 'bus_stops[%r]' % self.reference |
17
fa3c822859b5
Refaktorioitu aikatauluhaku
Teemu Piippo <teemu@hecknology.net>
parents:
15
diff
changeset
|
70 | def schedule(self, max_amount = 50): |
0 | 71 | ''' |
72 | Hakee tämän pysäkin seuraavat `määrä` lähtöä. Päätepysäkille saapuvia busseja ei | |
24
e6bdb9c54096
Yhtenäistetty ohjelmakoodin kieli englanniksi
Teemu Piippo <teemu@hecknology.net>
parents:
23
diff
changeset
|
73 | lasketa. Palauttaa pysähdykset listana jossa alkiot ovat muotoa (aika, halt), |
0 | 74 | jossa: |
75 | - `aika` on saapumishetki muotoa datetime ja | |
24
e6bdb9c54096
Yhtenäistetty ohjelmakoodin kieli englanniksi
Teemu Piippo <teemu@hecknology.net>
parents:
23
diff
changeset
|
76 | - `halt` on vastaava BusHalt olio. |
0 | 77 | |
78 | Mikäli pysäkille ei ole määrätty riittävästi pysähdyksiä kalenterissa, tuloslista | |
79 | jää alimittaiseksi, mahdollisesti jopa tyhjäksi. | |
80 | ''' | |
17
fa3c822859b5
Refaktorioitu aikatauluhaku
Teemu Piippo <teemu@hecknology.net>
parents:
15
diff
changeset
|
81 | result = [] |
20
3199e289ae62
- Sivusto hieman edustuksellisempi
Teemu Piippo <teemu@hecknology.net>
parents:
19
diff
changeset
|
82 | # -1 päivää yövuoroja varten |
24
e6bdb9c54096
Yhtenäistetty ohjelmakoodin kieli englanniksi
Teemu Piippo <teemu@hecknology.net>
parents:
23
diff
changeset
|
83 | date = today() - timedelta(days = 1) |
0 | 84 | # Niin kauan kuin aikatauluja ei ole vielä tarpeeksi, |
17
fa3c822859b5
Refaktorioitu aikatauluhaku
Teemu Piippo <teemu@hecknology.net>
parents:
15
diff
changeset
|
85 | while len(result) < max_amount: |
0 | 86 | try: |
87 | # hae nykyisen päivän aikataulut ja lisää ne, | |
17
fa3c822859b5
Refaktorioitu aikatauluhaku
Teemu Piippo <teemu@hecknology.net>
parents:
15
diff
changeset
|
88 | result += self.schedule_for_day(date) |
fa3c822859b5
Refaktorioitu aikatauluhaku
Teemu Piippo <teemu@hecknology.net>
parents:
15
diff
changeset
|
89 | except ValueError: |
0 | 90 | # paitsi jos mentiin kalenterin ulkopuolelle, jolloin lopetetaan, |
91 | break | |
92 | # ja siirry seuraavaan päivään. | |
17
fa3c822859b5
Refaktorioitu aikatauluhaku
Teemu Piippo <teemu@hecknology.net>
parents:
15
diff
changeset
|
93 | date += timedelta(1) |
0 | 94 | # Typistä lopputulos haluttuun tulosmäärään. |
17
fa3c822859b5
Refaktorioitu aikatauluhaku
Teemu Piippo <teemu@hecknology.net>
parents:
15
diff
changeset
|
95 | return result[:max_amount] |
fa3c822859b5
Refaktorioitu aikatauluhaku
Teemu Piippo <teemu@hecknology.net>
parents:
15
diff
changeset
|
96 | def schedule_for_day(self, date): |
fa3c822859b5
Refaktorioitu aikatauluhaku
Teemu Piippo <teemu@hecknology.net>
parents:
15
diff
changeset
|
97 | ''' |
fa3c822859b5
Refaktorioitu aikatauluhaku
Teemu Piippo <teemu@hecknology.net>
parents:
15
diff
changeset
|
98 | Hakee pysäkin aikataulut tiettynä päivänä. |
fa3c822859b5
Refaktorioitu aikatauluhaku
Teemu Piippo <teemu@hecknology.net>
parents:
15
diff
changeset
|
99 | ''' |
fa3c822859b5
Refaktorioitu aikatauluhaku
Teemu Piippo <teemu@hecknology.net>
parents:
15
diff
changeset
|
100 | # Jos päädyttiin aikataulukalenterin ulkopuolelle, niin tuotetaan virhe. Jos vain |
24
e6bdb9c54096
Yhtenäistetty ohjelmakoodin kieli englanniksi
Teemu Piippo <teemu@hecknology.net>
parents:
23
diff
changeset
|
101 | # palautettaisiin tyhjä result, niin algoritmi jatkaisi etsintää loputtomiin. |
17
fa3c822859b5
Refaktorioitu aikatauluhaku
Teemu Piippo <teemu@hecknology.net>
parents:
15
diff
changeset
|
102 | if date > viimeinen_käyttöpäivä: |
fa3c822859b5
Refaktorioitu aikatauluhaku
Teemu Piippo <teemu@hecknology.net>
parents:
15
diff
changeset
|
103 | raise ValueError('tried to retrieve schedule for date %s which is outside schedule data' % date) |
fa3c822859b5
Refaktorioitu aikatauluhaku
Teemu Piippo <teemu@hecknology.net>
parents:
15
diff
changeset
|
104 | result = [] |
fa3c822859b5
Refaktorioitu aikatauluhaku
Teemu Piippo <teemu@hecknology.net>
parents:
15
diff
changeset
|
105 | # Jokaiselle ajovuorolle, |
28
670ffa424ded
Bussipysäkit tallentavat ajovuoronsa välimuistiin suoritusajan nopeuttamiseksi
Teemu Piippo <teemu@hecknology.net>
parents:
26
diff
changeset
|
106 | for trip in self.involved_trips: |
17
fa3c822859b5
Refaktorioitu aikatauluhaku
Teemu Piippo <teemu@hecknology.net>
parents:
15
diff
changeset
|
107 | # jos tämä ajovuoro ajetaan tänä päivänä |
24
e6bdb9c54096
Yhtenäistetty ohjelmakoodin kieli englanniksi
Teemu Piippo <teemu@hecknology.net>
parents:
23
diff
changeset
|
108 | if trip.is_served_at(date): |
e6bdb9c54096
Yhtenäistetty ohjelmakoodin kieli englanniksi
Teemu Piippo <teemu@hecknology.net>
parents:
23
diff
changeset
|
109 | # ja jos tämä trip pysähtyy tällä pysäkillä, ei kuitenkaan saapuen |
17
fa3c822859b5
Refaktorioitu aikatauluhaku
Teemu Piippo <teemu@hecknology.net>
parents:
15
diff
changeset
|
110 | # päätepysäkille, |
24
e6bdb9c54096
Yhtenäistetty ohjelmakoodin kieli englanniksi
Teemu Piippo <teemu@hecknology.net>
parents:
23
diff
changeset
|
111 | stop = trip.contains_stop(self) |
29 | 112 | if stop and not stop.is_arrival: # stop is not trip.schedule[-1]: |
24
e6bdb9c54096
Yhtenäistetty ohjelmakoodin kieli englanniksi
Teemu Piippo <teemu@hecknology.net>
parents:
23
diff
changeset
|
113 | # ja jos tämä halt on tulevaisuudessa, |
e6bdb9c54096
Yhtenäistetty ohjelmakoodin kieli englanniksi
Teemu Piippo <teemu@hecknology.net>
parents:
23
diff
changeset
|
114 | stop_time = datetime.combine(date, time()) + stop.arrival_time |
e6bdb9c54096
Yhtenäistetty ohjelmakoodin kieli englanniksi
Teemu Piippo <teemu@hecknology.net>
parents:
23
diff
changeset
|
115 | if stop_time >= now(): |
e6bdb9c54096
Yhtenäistetty ohjelmakoodin kieli englanniksi
Teemu Piippo <teemu@hecknology.net>
parents:
23
diff
changeset
|
116 | # lisää halt listaan. |
18 | 117 | result.append({ |
118 | 'time': stop_time, | |
119 | 'trip': trip, | |
120 | 'stop': stop, | |
121 | }) | |
17
fa3c822859b5
Refaktorioitu aikatauluhaku
Teemu Piippo <teemu@hecknology.net>
parents:
15
diff
changeset
|
122 | # Lajittele lopputulos saapumisajan mukaan. |
18 | 123 | result.sort(key = lambda schedule_entry: schedule_entry['time']) |
17
fa3c822859b5
Refaktorioitu aikatauluhaku
Teemu Piippo <teemu@hecknology.net>
parents:
15
diff
changeset
|
124 | return result |
0 | 125 | |
24
e6bdb9c54096
Yhtenäistetty ohjelmakoodin kieli englanniksi
Teemu Piippo <teemu@hecknology.net>
parents:
23
diff
changeset
|
126 | class BusHalt: |
e6bdb9c54096
Yhtenäistetty ohjelmakoodin kieli englanniksi
Teemu Piippo <teemu@hecknology.net>
parents:
23
diff
changeset
|
127 | def __init__(self, arrival_time, departure_time, stop, trip, traveled_distance): |
e6bdb9c54096
Yhtenäistetty ohjelmakoodin kieli englanniksi
Teemu Piippo <teemu@hecknology.net>
parents:
23
diff
changeset
|
128 | self.arrival_time, self.departure_time, self.stop, self.trip = arrival_time, departure_time, \ |
e6bdb9c54096
Yhtenäistetty ohjelmakoodin kieli englanniksi
Teemu Piippo <teemu@hecknology.net>
parents:
23
diff
changeset
|
129 | stop, trip |
e6bdb9c54096
Yhtenäistetty ohjelmakoodin kieli englanniksi
Teemu Piippo <teemu@hecknology.net>
parents:
23
diff
changeset
|
130 | self.traveled_distance = traveled_distance |
23 | 131 | @property |
29 | 132 | def is_arrival(self): |
24
e6bdb9c54096
Yhtenäistetty ohjelmakoodin kieli englanniksi
Teemu Piippo <teemu@hecknology.net>
parents:
23
diff
changeset
|
133 | if not hasattr(self, 'cachedIsArrival'): |
29 | 134 | if self.stop.region: |
135 | iterator = iter(self.trip.schedule) | |
23 | 136 | stop = next(iterator) |
29 | 137 | while stop is not self: |
138 | stop = next(iterator) | |
139 | for stop in iterator: | |
140 | if stop.stop.region != self.stop.region: | |
141 | self.cachedIsArrival = False | |
142 | break | |
143 | else: | |
144 | self.cachedIsArrival = True | |
23 | 145 | else: |
29 | 146 | self.cachedIsArrival = False |
24
e6bdb9c54096
Yhtenäistetty ohjelmakoodin kieli englanniksi
Teemu Piippo <teemu@hecknology.net>
parents:
23
diff
changeset
|
147 | return self.cachedIsArrival |
0 | 148 | def __repr__(self): |
24
e6bdb9c54096
Yhtenäistetty ohjelmakoodin kieli englanniksi
Teemu Piippo <teemu@hecknology.net>
parents:
23
diff
changeset
|
149 | return 'BusHalt(%r, %r, %r, %r)' % (self.arrival_time, self.departure_time, self.stop, self.trip) |
0 | 150 | |
24
e6bdb9c54096
Yhtenäistetty ohjelmakoodin kieli englanniksi
Teemu Piippo <teemu@hecknology.net>
parents:
23
diff
changeset
|
151 | routes = {} |
e6bdb9c54096
Yhtenäistetty ohjelmakoodin kieli englanniksi
Teemu Piippo <teemu@hecknology.net>
parents:
23
diff
changeset
|
152 | routes_per_id = {} |
e6bdb9c54096
Yhtenäistetty ohjelmakoodin kieli englanniksi
Teemu Piippo <teemu@hecknology.net>
parents:
23
diff
changeset
|
153 | all_trips = {} |
e6bdb9c54096
Yhtenäistetty ohjelmakoodin kieli englanniksi
Teemu Piippo <teemu@hecknology.net>
parents:
23
diff
changeset
|
154 | services = {} |
e6bdb9c54096
Yhtenäistetty ohjelmakoodin kieli englanniksi
Teemu Piippo <teemu@hecknology.net>
parents:
23
diff
changeset
|
155 | bus_stops = {} |
15
a22cdf28930f
Lisätty bussipysäkkien ryhmittely
Teemu Piippo <teemu@hecknology.net>
parents:
7
diff
changeset
|
156 | all_clusters = set() |
30 | 157 | viimeinen_käyttöpäivä = None |
158 | clusters_by_name = {} | |
24
e6bdb9c54096
Yhtenäistetty ohjelmakoodin kieli englanniksi
Teemu Piippo <teemu@hecknology.net>
parents:
23
diff
changeset
|
159 | services_for_day = {} |
0 | 160 | |
30 | 161 | def load_buses(gtfs_zip_path, profile): |
162 | global viimeinen_käyttöpäivä | |
163 | from zipfile import ZipFile | |
164 | with ZipFile(gtfs_zip_path) as gtfs_zip: | |
165 | print('Ladataan linjat... ', file = stderr, end = '', flush = True) | |
166 | with gtfs_zip.open('routes.txt') as file: | |
167 | for row in read_csv(map(bytes.decode, file)): | |
168 | route = BusRoute(row) | |
169 | routes[route.reference] = route | |
170 | routes_per_id[route.id] = route | |
171 | print('%d linjaa' % len(routes), file = stderr) | |
172 | ||
173 | print('Ladataan ajovuorot... ', file = stderr, end = '', flush = True) | |
174 | ||
175 | shape_distances = {} | |
176 | with gtfs_zip.open('shapes.txt') as file: | |
177 | for row in read_csv(map(bytes.decode, file)): | |
178 | shape_distances[row['shape_id']] = max(shape_distances.get(row['shape_id'], 0), float(row['shape_dist_traveled'])) | |
29 | 179 | |
30 | 180 | with gtfs_zip.open('trips.txt') as file: |
181 | for row in read_csv(map(bytes.decode, file)): | |
182 | if row['service_id'] not in services: | |
183 | services[row['service_id']] = BusService(row['service_id']) | |
184 | route = routes_per_id[row['route_id']] | |
185 | trip = BusTrip( | |
186 | reference = row['trip_id'], | |
187 | route = route, | |
188 | service = services[row['service_id']], | |
189 | length = shape_distances[row['shape_id']] * float(profile['metrics']['shape-modifier']) | |
190 | ) | |
191 | route.trips.add(trip) | |
192 | assert trip.name not in all_trips | |
193 | all_trips[trip.name] = trip | |
194 | print('%d ajoa' % len(all_trips), file = stderr) | |
0 | 195 | |
30 | 196 | def read_date(teksti): |
197 | return date(int(teksti[:4]), int(teksti[4:6]), int(teksti[6:])) | |
198 | ||
199 | def read_time(teksti): | |
200 | tunti, minuutti, sekunti = map(int, teksti.split(':')) | |
201 | return timedelta(hours = tunti, minutes = minuutti, seconds = sekunti) | |
202 | ||
203 | print('Ladataan päiväykset... ', file = stderr, flush = True) | |
204 | ||
205 | viimeinen_käyttöpäivä = date.today() | |
29 | 206 | |
30 | 207 | def date_range(start_date, end_date, *, include_end = False): |
208 | ''' Generates date from start_date to end_date. If include_end is True, then end_date will be yielded. ''' | |
209 | current_date = start_date | |
210 | while current_date < end_date: | |
211 | yield current_date | |
212 | current_date += timedelta(1) | |
213 | if include_end: | |
214 | yield end_date | |
29 | 215 | |
30 | 216 | def add_day_to_service(service_name, day): |
217 | try: | |
218 | service = services[service_name] | |
219 | except KeyError: | |
220 | return | |
221 | else: | |
222 | service.dates.add(day) | |
223 | if day not in services_for_day: | |
224 | services_for_day[day] = set() | |
225 | services_for_day[day].add(service) | |
226 | global viimeinen_käyttöpäivä | |
227 | viimeinen_käyttöpäivä = max(day, viimeinen_käyttöpäivä) | |
29 | 228 | |
30 | 229 | def filter_day(row, day): |
230 | day_names = ['monday', 'tuesday', 'wednesday', 'thursday', 'friday', 'saturday', 'sunday'] | |
231 | return int(row[day_names[day.isoweekday() - 1]]) | |
0 | 232 | |
30 | 233 | with gtfs_zip.open('calendar.txt') as file: |
234 | for row in read_csv(map(bytes.decode, file)): | |
235 | for day in date_range(read_date(row['start_date']), read_date(row['end_date']), include_end = True): | |
236 | if filter_day(row, day): | |
237 | add_day_to_service(service_name = row['service_id'], day = day) | |
238 | ||
239 | with gtfs_zip.open('calendar_dates.txt') as file: | |
240 | for row in read_csv(map(bytes.decode, file)): | |
241 | add_day_to_service(service_name = row['service_id'], day = read_date(row['date'])) | |
242 | ||
243 | def services_available_at(day): | |
244 | for service in services.values(): | |
245 | if day in service.dates: | |
246 | yield service | |
247 | ||
248 | print('Ladataan pysäkit... ', file = stderr, end = '', flush = True) | |
249 | with gtfs_zip.open('stops.txt') as file: | |
250 | for row in read_csv(map(bytes.decode, file)): | |
251 | location = Sijainti(float(row['stop_lat']), float(row['stop_lon'])) | |
252 | stop = BusStop( | |
253 | reference = row['stop_id'], | |
254 | name = row['stop_name'], | |
255 | location = location, | |
256 | code = row['stop_code'], | |
257 | ) | |
258 | bus_stops[stop.reference] = stop | |
259 | with open('regions-per-stop.json') as file: | |
260 | for stop_reference, region in json.load(file).items(): | |
261 | bus_stops[stop_reference].region = region | |
262 | print('%d pysäkkiä' % len(bus_stops), file = stderr) | |
0 | 263 | |
21 | 264 | |
30 | 265 | class BusStopCluster: |
266 | def __init__(self): | |
267 | self.stops = set() | |
268 | self._center = None | |
269 | self.name = None | |
270 | @property | |
271 | def url_name(self): | |
272 | return self.name.lower().replace('(', '').replace(')', '').replace(' ', '-') | |
273 | def add_stop(self, stop): | |
274 | assert not stop.cluster | |
275 | stop.cluster = self | |
276 | self.stops.add(stop) | |
277 | self._center = None | |
278 | @property | |
279 | def center(self): | |
280 | if not self._center: | |
281 | if self.stops: | |
282 | from statistics import median | |
283 | pointtype = type(next(iter(self.stops)).location) | |
284 | self._center = pointtype( | |
285 | median(stop.location.x for stop in self.stops), | |
286 | median(stop.location.y for stop in self.stops), | |
287 | ) | |
288 | else: | |
289 | raise ValueError('an empty cluster has no center point') | |
290 | return self._center | |
291 | def merge(self, other): | |
292 | for bus_stop in other.stops: | |
293 | bus_stop.cluster = self | |
294 | self.stops |= other.stops | |
295 | other.stops = set() | |
296 | other._center = None | |
297 | def schedule(self, max_amount = 50): | |
298 | result = [] | |
299 | for stop in self.stops: | |
300 | result += stop.schedule(max_amount) | |
301 | result.sort(key = lambda schedule_entry: schedule_entry['time']) | |
302 | return result[:max_amount] | |
15
a22cdf28930f
Lisätty bussipysäkkien ryhmittely
Teemu Piippo <teemu@hecknology.net>
parents:
7
diff
changeset
|
303 | |
30 | 304 | from collections import defaultdict |
305 | bus_stops_by_name = defaultdict(set) | |
306 | for bus_stop in bus_stops.values(): | |
307 | bus_stops_by_name[bus_stop.name].add(bus_stop) | |
308 | bus_stops_by_name = dict(bus_stops_by_name) | |
15
a22cdf28930f
Lisätty bussipysäkkien ryhmittely
Teemu Piippo <teemu@hecknology.net>
parents:
7
diff
changeset
|
309 | |
30 | 310 | # ryhmittele bus_stops nimen mukaan |
311 | all_clusters = [] | |
312 | def cluster_bus_stops(): | |
313 | sorted_bus_stops = sorted(bus_stops.values(), key = lambda bus_stop: bus_stop.name) | |
314 | for bus_stop in sorted_bus_stops: | |
315 | if not bus_stop.cluster: | |
316 | stops_to_cluster = {bus_stop} | |
317 | # etsi pysäkin samannimiset vastaparit | |
318 | for pair_candidate in bus_stops_by_name[bus_stop.name]: | |
319 | distance = pair_candidate.location.etäisyys(bus_stop.location) | |
320 | if pair_candidate is not bus_stop and distance <= 0.4: | |
321 | stops_to_cluster.add(pair_candidate) | |
322 | for stop_to_cluster in stops_to_cluster: | |
323 | if stop_to_cluster.cluster: | |
324 | cluster = stop_to_cluster.cluster | |
325 | break | |
326 | else: | |
327 | cluster = BusStopCluster() | |
328 | all_clusters.append(cluster) | |
329 | for stop_to_cluster in stops_to_cluster: | |
330 | if not stop_to_cluster.cluster: | |
331 | cluster.add_stop(stop_to_cluster) | |
332 | # Merkitse muistiin pysäkkien vastaparit käyttäen hyväksi tämänhetkistä ryhmittelytietoa | |
333 | for bus_stop in bus_stops.values(): | |
334 | if bus_stop.cluster: | |
335 | bus_stop.pairs = bus_stop.cluster.stops - {bus_stop} | |
336 | # Ryhmitä ne bus_stops, joilla ei ollut omaa vastaparia, muiden pysäkkien kanssa | |
337 | for bus_stop in sorted_bus_stops: | |
338 | if len(bus_stop.cluster.stops) == 1: | |
339 | possibilities = set() | |
340 | for cluster in all_clusters: | |
341 | if cluster is not bus_stop.cluster: | |
342 | distance = cluster.center.etäisyys(bus_stop.location) | |
343 | if distance <= 0.4: | |
344 | possibilities.add((distance, cluster)) | |
345 | if possibilities: | |
346 | best = min(possibilities)[1] | |
347 | all_clusters.remove(bus_stop.cluster) | |
348 | best.merge(bus_stop.cluster) | |
15
a22cdf28930f
Lisätty bussipysäkkien ryhmittely
Teemu Piippo <teemu@hecknology.net>
parents:
7
diff
changeset
|
349 | |
30 | 350 | def shared_elements_in_n_sets(sets): |
351 | from itertools import combinations | |
352 | result = set() | |
353 | for pair in combinations(sets, 2): | |
354 | result |= pair[0] & pair[1] | |
355 | return result | |
15
a22cdf28930f
Lisätty bussipysäkkien ryhmittely
Teemu Piippo <teemu@hecknology.net>
parents:
7
diff
changeset
|
356 | |
30 | 357 | def name_clusters(): |
358 | from collections import defaultdict | |
359 | from pprint import pprint | |
360 | clusters_per_name = defaultdict(set) | |
361 | for cluster in all_clusters: | |
362 | name_representing_stop = min((len(stop.reference), stop.reference, stop) for stop in cluster.stops)[2] | |
363 | clusters_per_name[name_representing_stop.name].add(cluster) | |
364 | for name, clusters in clusters_per_name.items(): | |
365 | if len(clusters) == 1: | |
366 | # Ryhmä on ainoa jolla on varaus tälle nimelle. Sen kuin vaan. | |
367 | next(iter(clusters)).name = name | |
368 | else: | |
369 | # Olisiko kaikki klusterit eri alueilla? | |
370 | common_regions = shared_elements_in_n_sets({stop.region for stop in cluster.stops} for cluster in clusters) | |
371 | # Esitys: ryhmä -> ne alueet jotka ovat tälle ryhmälle ainutlaatuisia | |
372 | proposal = { | |
373 | cluster: {stop.region for stop in cluster.stops} - common_regions - {None} | |
374 | for cluster in clusters | |
375 | } | |
376 | # Jos enintään yksi klusteri tässä esityksessä on kokonaan ilman omaa aluetta, jolla se voisi eritellä, | |
377 | # niin nimetään klusterit näiden alueiden mukaan. | |
378 | # Se klusteri jolla ei ole omaa aluetta (jos on) jätetään ilman aluepäätettä. | |
379 | if sum([1 for unique_areas in proposal.values() if not unique_areas]) <= 1: | |
380 | for cluster, unique_areas in proposal.items(): | |
381 | individual_cluster_name = name | |
382 | if unique_areas: | |
383 | individual_cluster_name += ' (' + min(unique_areas) + ')' | |
384 | cluster.name = individual_cluster_name | |
385 | else: | |
386 | # Typerä reunatapaus. Indeksoidaan numeroin... | |
387 | for n, (_, cluster) in enumerate(sorted( | |
388 | min((stop.reference.lower(), cluster) for stop in cluster.stops) | |
389 | for cluster in clusters | |
390 | ), 1): | |
391 | individual_cluster_name = name + '-' + str(n) | |
392 | cluster.name = individual_cluster_name | |
393 | ||
394 | print('Ryhmitellään pysäkit...') | |
395 | cluster_bus_stops() | |
396 | name_clusters() | |
397 | ||
398 | for cluster in all_clusters: | |
399 | if cluster.url_name in clusters_by_name: | |
400 | print('Warning: Clusters %r and %r share the same URL name: %r' % (cluster.name, clusters_by_name[cluster.url_name].name, cluster.url_name)) | |
15
a22cdf28930f
Lisätty bussipysäkkien ryhmittely
Teemu Piippo <teemu@hecknology.net>
parents:
7
diff
changeset
|
401 | else: |
30 | 402 | clusters_by_name[cluster.url_name] = cluster |
19
16fa9fb20b32
Lisätty pysäkkiryhmän aikataulunäkymä
Teemu Piippo <teemu@hecknology.net>
parents:
18
diff
changeset
|
403 | |
30 | 404 | print('Ladataan aikataulut... ', end = '', flush = True, file = stderr) |
405 | with gtfs_zip.open('stop_times.txt') as file: | |
406 | row_count = sum(line.count(b'\n') for line in file) | |
407 | with gtfs_zip.open('stop_times.txt') as file: | |
408 | progress = 0 | |
409 | for row in read_csv(map(bytes.decode, file)): | |
410 | trip = all_trips[transform_trip_reference(row['trip_id'])] | |
411 | arrival_time = read_time(row['arrival_time']) | |
412 | departure_time = read_time(row['departure_time']) | |
413 | stop = bus_stops[row['stop_id']] | |
414 | traveled_distance = float(row['shape_dist_traveled']) * float(profile['metrics']['shape-modifier']) | |
415 | trip.schedule.append(BusHalt(arrival_time, departure_time, stop, trip, traveled_distance)) | |
416 | stop.involved_trips.add(trip) | |
417 | progress += 1 | |
418 | if progress % 1000 == 0: | |
419 | print('\rLadataan aikataulut... %.1f%%' % (progress * 100 / row_count), end = ' ', file = stderr) | |
420 | print('\rLadataan aikataulut... ladattu', file = stderr) | |
421 | ||
422 | for trip in all_trips.values(): | |
423 | from busroute import simplify_name | |
424 | schedule = trip.concise_schedule() | |
425 | try: | |
426 | trip.from_place = simplify_name(schedule[0]) | |
427 | trip.to_place = simplify_name(schedule[-1]) | |
428 | except IndexError: | |
429 | trip.from_place = '' | |
430 | trip.to_place = '' | |
28
670ffa424ded
Bussipysäkit tallentavat ajovuoronsa välimuistiin suoritusajan nopeuttamiseksi
Teemu Piippo <teemu@hecknology.net>
parents:
26
diff
changeset
|
431 | |
30 | 432 | for route in routes.values(): |
433 | from collections import Counter | |
434 | from busroute import simplify_name | |
435 | tally = Counter() | |
436 | for trip in route.trips: | |
437 | schedule = trip.concise_schedule() | |
438 | places = set(schedule) | |
439 | do_add = True | |
440 | assert type(schedule) is list | |
441 | for candidate in tally: | |
442 | if places.issubset(set(candidate)): | |
443 | do_add = False | |
444 | tally.update({tuple(candidate)}) | |
445 | if do_add: | |
446 | tally.update({tuple(schedule)}) | |
447 | try: | |
448 | most_common_route = tally.most_common(1)[0][0] | |
449 | route.description = simplify_name(most_common_route[0]) + ' - ' + simplify_name(most_common_route[-1]) | |
450 | except: | |
451 | route.description = '' | |
452 | route.trips = sorted(route.trips, key = lambda trip: trip.schedule[0].departure_time) | |
28
670ffa424ded
Bussipysäkit tallentavat ajovuoronsa välimuistiin suoritusajan nopeuttamiseksi
Teemu Piippo <teemu@hecknology.net>
parents:
26
diff
changeset
|
453 | |
30 | 454 | # Fölin datassa on jotain tosi kummaa. Ilmeisesti ajovuoron viimeisen pysähdyksen saapumisaika on ihan täysin |
455 | # väärin. Arvaan että se on seuraavan lähdön aika, mutta joka tapauksessa se on väärin. | |
456 | # Arvataan mikä se todellinen saapumisaika on. Se ei voi mennä kauhean paljon pahemmin vikaan kuin alkuperäinen | |
457 | # väärin oleva data. | |
458 | for trip in all_trips.values(): | |
459 | bus_speed_coefficient = 750 # metriä minuutissa | |
460 | last_leg_distance = trip.schedule[-1].traveled_distance - trip.schedule[-2].traveled_distance | |
461 | trip.schedule[-1].arrival_time = trip.schedule[-2].departure_time + timedelta(minutes = last_leg_distance / bus_speed_coefficient) | |
462 | ||
463 | if __name__ == '__main__': | |
464 | from configparser import ConfigParser | |
465 | profile = ConfigParser() | |
466 | profile.read('profiles/föli.ini') | |
467 | load_buses('gtfs.zip', profile) |