Sat, 10 Jun 2017 20:56:38 +0300
Lisätty bussipysäkkien ryhmittely
0 | 1 | #!/usr/bin/env python3 |
2 | 2 | import enum, json |
3 | from sys import stderr | |
0 | 4 | from datetime import date, time, datetime, timedelta |
5 | 5 | from copy import copy |
2 | 6 | from misc import * |
7
f3791dccfd03
Käännetty tiedostojen nimet englanniksi
Teemu Piippo <teemu@hecknology.net>
parents:
5
diff
changeset
|
7 | from geometry import * |
0 | 8 | Suunta = enum.Enum('Suunta', [('Taaksepäin', 0), ('Eteenpäin', 1)]) |
9 | ||
10 | def muunna_ajovuoro_tunniste(tunniste): | |
4 | 11 | return tunniste |
0 | 12 | |
13 | class Ajovuoro: | |
14 | def __init__(self, tunniste, linja, palvelu, kyltti, suunta): | |
15 | self.tunniste, self.linja, self.palvelu, self.kyltti, self.suunta = tunniste, linja, \ | |
16 | palvelu, kyltti, suunta | |
17 | self.reitti = [] | |
18 | self.nimi = muunna_ajovuoro_tunniste(tunniste) | |
19 | def __repr__(self): | |
20 | return 'ajot[%r]' % self.nimi | |
21 | def pysäkkiReitillä(self, pysäkki): | |
22 | for pysähdys in self.reitti: | |
23 | if pysähdys.pysäkki is pysäkki: | |
24 | return pysähdys | |
25 | else: | |
26 | return None | |
27 | def ajetaan_päivänä(self, päivä): | |
28 | try: | |
29 | return self.palvelu in palvelut_per_päivä[päivä] | |
30 | except KeyError: | |
31 | return False | |
5 | 32 | def suppea_reitti(self, pysäkistä = None): |
33 | if pysäkistä and pysäkistä in self.reitti: | |
34 | reitti = copy(self.reitti) | |
35 | reitti = reitti[reitti.index(pysäkistä):] | |
36 | else: | |
37 | reitti = self.reitti | |
38 | käytetyt_alueet = set() | |
39 | tulos = [] | |
40 | for pysähdys in reitti: | |
41 | pysäkki = pysähdys.pysäkki | |
42 | if pysäkki.alue and pysäkki.alue not in käytetyt_alueet: | |
43 | käytetyt_alueet.add(pysäkki.alue) | |
44 | tulos.append(pysäkki.alue) | |
45 | return tulos | |
0 | 46 | |
47 | class Linja: | |
48 | def __init__(self, tietue): | |
49 | self.tunniste = tietue['route_id'] | |
50 | self.viite = tietue['route_short_name'] | |
51 | self.selite = tietue['route_long_name'] | |
52 | def __repr__(self): | |
53 | return 'linjat[%r]' % self.viite | |
54 | ||
55 | class Palvelu: | |
56 | def __init__(self, tunniste): | |
57 | self.tunniste = tunniste | |
58 | self.päivät = set() | |
59 | def __repr__(self): | |
60 | return 'palvelut[%r]' % self.tunniste | |
61 | ||
62 | class Pysäkki: | |
2 | 63 | def __init__(self, tunniste, nimi, sijainti): |
64 | self.tunniste, self.nimi, self.sijainti = tunniste, nimi, sijainti | |
15
a22cdf28930f
Lisätty bussipysäkkien ryhmittely
Teemu Piippo <teemu@hecknology.net>
parents:
7
diff
changeset
|
65 | self.cluster = None |
a22cdf28930f
Lisätty bussipysäkkien ryhmittely
Teemu Piippo <teemu@hecknology.net>
parents:
7
diff
changeset
|
66 | self.pairs = set() # samannimiset lähellä olevat pysäkit |
0 | 67 | def __repr__(self): |
68 | return 'pysäkit[%r]' % self.tunniste | |
69 | def aikataulu(self, määrä = 50): | |
70 | ''' | |
71 | Hakee tämän pysäkin seuraavat `määrä` lähtöä. Päätepysäkille saapuvia busseja ei | |
72 | lasketa. Palauttaa pysähdykset listana jossa alkiot ovat muotoa (aika, pysähdys), | |
73 | jossa: | |
74 | - `aika` on saapumishetki muotoa datetime ja | |
75 | - `pysähdys` on vastaava Pysähdys olio. | |
76 | ||
77 | Mikäli pysäkille ei ole määrätty riittävästi pysähdyksiä kalenterissa, tuloslista | |
78 | jää alimittaiseksi, mahdollisesti jopa tyhjäksi. | |
79 | ''' | |
80 | class PäivätLoppuError(Exception): | |
81 | pass | |
82 | # Hakee pysäkin aikataulut tiettynä päivänä. | |
83 | def aikataulu_päivänä(päivä): | |
84 | # Jos päädyttiin aikataulukalenterin ulkopuolelle, niin tuotetaan virhe. Jos vain | |
85 | # palautettaisiin tyhjä tulos, niin algoritmi jatkaisi etsintää loputtomiin. | |
86 | if päivä > viimeinen_käyttöpäivä: | |
87 | raise PäivätLoppuError() | |
88 | taulu = [] | |
89 | # Jokaiselle ajovuorolle, | |
90 | for ajo in ajot.values(): | |
91 | # jos tämä ajovuoro ajetaan tänä päivänä | |
92 | if ajo.ajetaan_päivänä(päivä): | |
93 | # ja jos tämä ajo pysähtyy tällä pysäkillä, ei kuitenkaan saapuen | |
94 | # päätepysäkille, | |
95 | pysähdys = ajo.pysäkkiReitillä(self) | |
96 | if pysähdys and pysähdys is not ajo.reitti[-1]: | |
97 | # ja jos tämä pysähdys on tulevaisuudessa, | |
98 | aika = datetime.combine(päivä, time()) + pysähdys.saapumisaika | |
4 | 99 | if aika >= nyt(): |
0 | 100 | # lisää pysähdys listaan. |
101 | taulu.append((aika, pysähdys)) | |
102 | # Lajittele lopputulos saapumisajan mukaan. | |
103 | taulu.sort(key = lambda tietue: tietue[0]) | |
104 | return taulu | |
105 | taulu = [] | |
4 | 106 | päivä = tänään() |
0 | 107 | # Niin kauan kuin aikatauluja ei ole vielä tarpeeksi, |
108 | while len(taulu) < määrä: | |
109 | try: | |
110 | # hae nykyisen päivän aikataulut ja lisää ne, | |
111 | taulu += aikataulu_päivänä(päivä) | |
112 | except PäivätLoppuError: | |
113 | # paitsi jos mentiin kalenterin ulkopuolelle, jolloin lopetetaan, | |
114 | break | |
115 | # ja siirry seuraavaan päivään. | |
116 | päivä += timedelta(1) | |
117 | # Typistä lopputulos haluttuun tulosmäärään. | |
118 | return taulu[:määrä] | |
5 | 119 | @property |
120 | def linkki_karttaan(self): | |
121 | return 'http://www.openstreetmap.org/#map=19/%f/%f' % (self.sijainti.leveys, self.sijainti.pituus) | |
0 | 122 | |
123 | class Pysähdys: | |
124 | def __init__(self, saapumisaika, lähtöaika, pysäkki, ajo): | |
125 | self.saapumisaika, self.lähtöaika, self.pysäkki, self.ajo = saapumisaika, lähtöaika, \ | |
126 | pysäkki, ajo | |
127 | def __repr__(self): | |
128 | return 'Pysähdys(%r, %r, %r, %r)' % (self.saapumisaika, self.lähtöaika, self.pysäkki, self.ajo) | |
129 | ||
130 | linjat = {} | |
131 | linjat_per_tunniste = {} | |
132 | ajot = {} | |
133 | ajot_per_numero = {} | |
134 | palvelut = {} | |
135 | pysäkit = {} | |
15
a22cdf28930f
Lisätty bussipysäkkien ryhmittely
Teemu Piippo <teemu@hecknology.net>
parents:
7
diff
changeset
|
136 | all_clusters = set() |
0 | 137 | |
2 | 138 | print('Ladataan linjat... ', file = stderr, end = '', flush = True) |
0 | 139 | with open('gtfs/routes.txt') as tiedosto: |
140 | for rivi in lue_csv(tiedosto): | |
141 | linja = Linja(rivi) | |
142 | linja.tunniste = linja.tunniste | |
143 | linjat[linja.viite] = linja | |
144 | linjat_per_tunniste[linja.tunniste] = linja | |
2 | 145 | print('%d linjaa' % len(linjat), file = stderr) |
0 | 146 | |
2 | 147 | print('Ladataan ajot... ', file = stderr, end = '', flush = True) |
0 | 148 | with open('gtfs/trips.txt') as tiedosto: |
149 | for rivi in lue_csv(tiedosto, muunnokset = {'direction_id': lambda k: Suunta(int(k))}): | |
150 | if rivi['service_id'] not in palvelut: | |
151 | palvelut[rivi['service_id']] = Palvelu(rivi['service_id']) | |
152 | linja = linjat_per_tunniste[rivi['route_id']] | |
153 | ajo = Ajovuoro(tunniste = rivi['trip_id'], | |
154 | linja = linja, | |
155 | palvelu = palvelut[rivi['service_id']], | |
156 | kyltti = rivi['trip_headsign'], | |
157 | suunta = rivi['direction_id']) | |
158 | assert ajo.nimi not in ajot | |
159 | ajot[ajo.nimi] = ajo | |
2 | 160 | print('%d ajoa' % len(ajot), file = stderr) |
0 | 161 | |
162 | def lue_päiväys(teksti): | |
163 | return date(int(teksti[:4]), int(teksti[4:6]), int(teksti[6:])) | |
164 | ||
165 | def lue_aika(teksti): | |
166 | tunti, minuutti, sekunti = map(int, teksti.split(':')) | |
167 | return timedelta(hours = tunti, minutes = minuutti, seconds = sekunti) | |
168 | ||
2 | 169 | print('Ladataan päiväykset... ', file = stderr, flush = True) |
0 | 170 | |
171 | viimeinen_käyttöpäivä = date.today() | |
172 | palvelut_per_päivä = {} | |
173 | ||
174 | with open('gtfs/calendar_dates.txt') as tiedosto: | |
175 | for rivi in lue_csv(tiedosto): | |
176 | palvelu = palvelut[rivi['service_id']] | |
177 | päivä = lue_päiväys(rivi['date']) | |
178 | palvelu.päivät.add(päivä) | |
179 | if päivä not in palvelut_per_päivä: | |
180 | palvelut_per_päivä[päivä] = set() | |
181 | palvelut_per_päivä[päivä].add(palvelu) | |
182 | viimeinen_käyttöpäivä = max(päivä, viimeinen_käyttöpäivä) | |
183 | ||
184 | def palvelut_käytössä(päivä): | |
185 | for palvelu in palvelut.values(): | |
186 | if päivä in palvelu.päivät: | |
187 | yield palvelu | |
188 | ||
2 | 189 | print('Ladataan pysäkit... ', file = stderr, end = '', flush = True) |
0 | 190 | with open('gtfs/stops.txt') as file: |
191 | for rivi in lue_csv(file): | |
5 | 192 | sijainti = Sijainti(float(rivi['stop_lat']), float(rivi['stop_lon'])) |
2 | 193 | pysäkki = Pysäkki(rivi['stop_id'], rivi['stop_name'], sijainti) |
0 | 194 | pysäkit[pysäkki.tunniste] = pysäkki |
7
f3791dccfd03
Käännetty tiedostojen nimet englanniksi
Teemu Piippo <teemu@hecknology.net>
parents:
5
diff
changeset
|
195 | with open('regions-per-stop.json') as file: |
2 | 196 | for pysäkkitunniste, alue in json.load(file).items(): |
197 | pysäkit[pysäkkitunniste].alue = alue | |
198 | print('%d pysäkkiä' % len(pysäkit), file = stderr) | |
0 | 199 | |
15
a22cdf28930f
Lisätty bussipysäkkien ryhmittely
Teemu Piippo <teemu@hecknology.net>
parents:
7
diff
changeset
|
200 | class BusStopCluster: |
a22cdf28930f
Lisätty bussipysäkkien ryhmittely
Teemu Piippo <teemu@hecknology.net>
parents:
7
diff
changeset
|
201 | def __init__(self): |
a22cdf28930f
Lisätty bussipysäkkien ryhmittely
Teemu Piippo <teemu@hecknology.net>
parents:
7
diff
changeset
|
202 | self.stops = set() |
a22cdf28930f
Lisätty bussipysäkkien ryhmittely
Teemu Piippo <teemu@hecknology.net>
parents:
7
diff
changeset
|
203 | self._center = None |
a22cdf28930f
Lisätty bussipysäkkien ryhmittely
Teemu Piippo <teemu@hecknology.net>
parents:
7
diff
changeset
|
204 | self.name = None |
a22cdf28930f
Lisätty bussipysäkkien ryhmittely
Teemu Piippo <teemu@hecknology.net>
parents:
7
diff
changeset
|
205 | def add_stop(self, stop): |
a22cdf28930f
Lisätty bussipysäkkien ryhmittely
Teemu Piippo <teemu@hecknology.net>
parents:
7
diff
changeset
|
206 | assert not stop.cluster |
a22cdf28930f
Lisätty bussipysäkkien ryhmittely
Teemu Piippo <teemu@hecknology.net>
parents:
7
diff
changeset
|
207 | stop.cluster = self |
a22cdf28930f
Lisätty bussipysäkkien ryhmittely
Teemu Piippo <teemu@hecknology.net>
parents:
7
diff
changeset
|
208 | self.stops.add(stop) |
a22cdf28930f
Lisätty bussipysäkkien ryhmittely
Teemu Piippo <teemu@hecknology.net>
parents:
7
diff
changeset
|
209 | self._center = None |
a22cdf28930f
Lisätty bussipysäkkien ryhmittely
Teemu Piippo <teemu@hecknology.net>
parents:
7
diff
changeset
|
210 | @property |
a22cdf28930f
Lisätty bussipysäkkien ryhmittely
Teemu Piippo <teemu@hecknology.net>
parents:
7
diff
changeset
|
211 | def center(self): |
a22cdf28930f
Lisätty bussipysäkkien ryhmittely
Teemu Piippo <teemu@hecknology.net>
parents:
7
diff
changeset
|
212 | if not self._center: |
a22cdf28930f
Lisätty bussipysäkkien ryhmittely
Teemu Piippo <teemu@hecknology.net>
parents:
7
diff
changeset
|
213 | if self.stops: |
a22cdf28930f
Lisätty bussipysäkkien ryhmittely
Teemu Piippo <teemu@hecknology.net>
parents:
7
diff
changeset
|
214 | from statistics import median |
a22cdf28930f
Lisätty bussipysäkkien ryhmittely
Teemu Piippo <teemu@hecknology.net>
parents:
7
diff
changeset
|
215 | pointtype = type(next(iter(self.stops)).sijainti) |
a22cdf28930f
Lisätty bussipysäkkien ryhmittely
Teemu Piippo <teemu@hecknology.net>
parents:
7
diff
changeset
|
216 | self._center = pointtype( |
a22cdf28930f
Lisätty bussipysäkkien ryhmittely
Teemu Piippo <teemu@hecknology.net>
parents:
7
diff
changeset
|
217 | median(stop.sijainti.x for stop in self.stops), |
a22cdf28930f
Lisätty bussipysäkkien ryhmittely
Teemu Piippo <teemu@hecknology.net>
parents:
7
diff
changeset
|
218 | median(stop.sijainti.y for stop in self.stops), |
a22cdf28930f
Lisätty bussipysäkkien ryhmittely
Teemu Piippo <teemu@hecknology.net>
parents:
7
diff
changeset
|
219 | ) |
a22cdf28930f
Lisätty bussipysäkkien ryhmittely
Teemu Piippo <teemu@hecknology.net>
parents:
7
diff
changeset
|
220 | else: |
a22cdf28930f
Lisätty bussipysäkkien ryhmittely
Teemu Piippo <teemu@hecknology.net>
parents:
7
diff
changeset
|
221 | raise ValueError('an empty cluster has no center point') |
a22cdf28930f
Lisätty bussipysäkkien ryhmittely
Teemu Piippo <teemu@hecknology.net>
parents:
7
diff
changeset
|
222 | return self._center |
a22cdf28930f
Lisätty bussipysäkkien ryhmittely
Teemu Piippo <teemu@hecknology.net>
parents:
7
diff
changeset
|
223 | def merge(self, other): |
a22cdf28930f
Lisätty bussipysäkkien ryhmittely
Teemu Piippo <teemu@hecknology.net>
parents:
7
diff
changeset
|
224 | for bus_stop in other.stops: |
a22cdf28930f
Lisätty bussipysäkkien ryhmittely
Teemu Piippo <teemu@hecknology.net>
parents:
7
diff
changeset
|
225 | bus_stop.cluster = self |
a22cdf28930f
Lisätty bussipysäkkien ryhmittely
Teemu Piippo <teemu@hecknology.net>
parents:
7
diff
changeset
|
226 | self.stops |= other.stops |
a22cdf28930f
Lisätty bussipysäkkien ryhmittely
Teemu Piippo <teemu@hecknology.net>
parents:
7
diff
changeset
|
227 | other.stops = set() |
a22cdf28930f
Lisätty bussipysäkkien ryhmittely
Teemu Piippo <teemu@hecknology.net>
parents:
7
diff
changeset
|
228 | other._center = None |
a22cdf28930f
Lisätty bussipysäkkien ryhmittely
Teemu Piippo <teemu@hecknology.net>
parents:
7
diff
changeset
|
229 | |
a22cdf28930f
Lisätty bussipysäkkien ryhmittely
Teemu Piippo <teemu@hecknology.net>
parents:
7
diff
changeset
|
230 | from collections import defaultdict |
a22cdf28930f
Lisätty bussipysäkkien ryhmittely
Teemu Piippo <teemu@hecknology.net>
parents:
7
diff
changeset
|
231 | bus_stops_by_name = defaultdict(set) |
a22cdf28930f
Lisätty bussipysäkkien ryhmittely
Teemu Piippo <teemu@hecknology.net>
parents:
7
diff
changeset
|
232 | for bus_stop in pysäkit.values(): |
a22cdf28930f
Lisätty bussipysäkkien ryhmittely
Teemu Piippo <teemu@hecknology.net>
parents:
7
diff
changeset
|
233 | bus_stops_by_name[bus_stop.nimi].add(bus_stop) |
a22cdf28930f
Lisätty bussipysäkkien ryhmittely
Teemu Piippo <teemu@hecknology.net>
parents:
7
diff
changeset
|
234 | bus_stops_by_name = dict(bus_stops_by_name) |
a22cdf28930f
Lisätty bussipysäkkien ryhmittely
Teemu Piippo <teemu@hecknology.net>
parents:
7
diff
changeset
|
235 | |
a22cdf28930f
Lisätty bussipysäkkien ryhmittely
Teemu Piippo <teemu@hecknology.net>
parents:
7
diff
changeset
|
236 | # ryhmittele pysäkit nimen mukaan |
a22cdf28930f
Lisätty bussipysäkkien ryhmittely
Teemu Piippo <teemu@hecknology.net>
parents:
7
diff
changeset
|
237 | all_clusters = [] |
a22cdf28930f
Lisätty bussipysäkkien ryhmittely
Teemu Piippo <teemu@hecknology.net>
parents:
7
diff
changeset
|
238 | def cluster_bus_stops(): |
a22cdf28930f
Lisätty bussipysäkkien ryhmittely
Teemu Piippo <teemu@hecknology.net>
parents:
7
diff
changeset
|
239 | sorted_bus_stops = sorted(pysäkit.values(), key = lambda bus_stop: bus_stop.nimi) |
a22cdf28930f
Lisätty bussipysäkkien ryhmittely
Teemu Piippo <teemu@hecknology.net>
parents:
7
diff
changeset
|
240 | for bus_stop in sorted_bus_stops: |
a22cdf28930f
Lisätty bussipysäkkien ryhmittely
Teemu Piippo <teemu@hecknology.net>
parents:
7
diff
changeset
|
241 | if not bus_stop.cluster: |
a22cdf28930f
Lisätty bussipysäkkien ryhmittely
Teemu Piippo <teemu@hecknology.net>
parents:
7
diff
changeset
|
242 | stops_to_cluster = {bus_stop} |
a22cdf28930f
Lisätty bussipysäkkien ryhmittely
Teemu Piippo <teemu@hecknology.net>
parents:
7
diff
changeset
|
243 | # etsi pysäkin samannimiset vastaparit |
a22cdf28930f
Lisätty bussipysäkkien ryhmittely
Teemu Piippo <teemu@hecknology.net>
parents:
7
diff
changeset
|
244 | for pair_candidate in bus_stops_by_name[bus_stop.nimi]: |
a22cdf28930f
Lisätty bussipysäkkien ryhmittely
Teemu Piippo <teemu@hecknology.net>
parents:
7
diff
changeset
|
245 | distance = pair_candidate.sijainti.etäisyys(bus_stop.sijainti) |
a22cdf28930f
Lisätty bussipysäkkien ryhmittely
Teemu Piippo <teemu@hecknology.net>
parents:
7
diff
changeset
|
246 | if pair_candidate is not bus_stop and distance <= 0.3: |
a22cdf28930f
Lisätty bussipysäkkien ryhmittely
Teemu Piippo <teemu@hecknology.net>
parents:
7
diff
changeset
|
247 | stops_to_cluster.add(pair_candidate) |
a22cdf28930f
Lisätty bussipysäkkien ryhmittely
Teemu Piippo <teemu@hecknology.net>
parents:
7
diff
changeset
|
248 | for stop_to_cluster in stops_to_cluster: |
a22cdf28930f
Lisätty bussipysäkkien ryhmittely
Teemu Piippo <teemu@hecknology.net>
parents:
7
diff
changeset
|
249 | if stop_to_cluster.cluster: |
a22cdf28930f
Lisätty bussipysäkkien ryhmittely
Teemu Piippo <teemu@hecknology.net>
parents:
7
diff
changeset
|
250 | cluster = stop_to_cluster.cluster |
a22cdf28930f
Lisätty bussipysäkkien ryhmittely
Teemu Piippo <teemu@hecknology.net>
parents:
7
diff
changeset
|
251 | break |
a22cdf28930f
Lisätty bussipysäkkien ryhmittely
Teemu Piippo <teemu@hecknology.net>
parents:
7
diff
changeset
|
252 | else: |
a22cdf28930f
Lisätty bussipysäkkien ryhmittely
Teemu Piippo <teemu@hecknology.net>
parents:
7
diff
changeset
|
253 | cluster = BusStopCluster() |
a22cdf28930f
Lisätty bussipysäkkien ryhmittely
Teemu Piippo <teemu@hecknology.net>
parents:
7
diff
changeset
|
254 | all_clusters.append(cluster) |
a22cdf28930f
Lisätty bussipysäkkien ryhmittely
Teemu Piippo <teemu@hecknology.net>
parents:
7
diff
changeset
|
255 | for stop_to_cluster in stops_to_cluster: |
a22cdf28930f
Lisätty bussipysäkkien ryhmittely
Teemu Piippo <teemu@hecknology.net>
parents:
7
diff
changeset
|
256 | if not stop_to_cluster.cluster: |
a22cdf28930f
Lisätty bussipysäkkien ryhmittely
Teemu Piippo <teemu@hecknology.net>
parents:
7
diff
changeset
|
257 | cluster.add_stop(stop_to_cluster) |
a22cdf28930f
Lisätty bussipysäkkien ryhmittely
Teemu Piippo <teemu@hecknology.net>
parents:
7
diff
changeset
|
258 | # Merkitse muistiin pysäkkien vastaparit käyttäen hyväksi tämänhetkistä ryhmittelytietoa |
a22cdf28930f
Lisätty bussipysäkkien ryhmittely
Teemu Piippo <teemu@hecknology.net>
parents:
7
diff
changeset
|
259 | for bus_stop in pysäkit.values(): |
a22cdf28930f
Lisätty bussipysäkkien ryhmittely
Teemu Piippo <teemu@hecknology.net>
parents:
7
diff
changeset
|
260 | if bus_stop.cluster: |
a22cdf28930f
Lisätty bussipysäkkien ryhmittely
Teemu Piippo <teemu@hecknology.net>
parents:
7
diff
changeset
|
261 | bus_stop.pairs = bus_stop.cluster.stops - {bus_stop} |
a22cdf28930f
Lisätty bussipysäkkien ryhmittely
Teemu Piippo <teemu@hecknology.net>
parents:
7
diff
changeset
|
262 | # Ryhmitä ne pysäkit, joilla ei ollut omaa vastaparia, muiden pysäkkien kanssa |
a22cdf28930f
Lisätty bussipysäkkien ryhmittely
Teemu Piippo <teemu@hecknology.net>
parents:
7
diff
changeset
|
263 | for bus_stop in sorted_bus_stops: |
a22cdf28930f
Lisätty bussipysäkkien ryhmittely
Teemu Piippo <teemu@hecknology.net>
parents:
7
diff
changeset
|
264 | if len(bus_stop.cluster.stops) == 1: |
a22cdf28930f
Lisätty bussipysäkkien ryhmittely
Teemu Piippo <teemu@hecknology.net>
parents:
7
diff
changeset
|
265 | possibilities = set() |
a22cdf28930f
Lisätty bussipysäkkien ryhmittely
Teemu Piippo <teemu@hecknology.net>
parents:
7
diff
changeset
|
266 | for cluster in all_clusters: |
a22cdf28930f
Lisätty bussipysäkkien ryhmittely
Teemu Piippo <teemu@hecknology.net>
parents:
7
diff
changeset
|
267 | if cluster is not bus_stop.cluster: |
a22cdf28930f
Lisätty bussipysäkkien ryhmittely
Teemu Piippo <teemu@hecknology.net>
parents:
7
diff
changeset
|
268 | distance = cluster.center.etäisyys(bus_stop.sijainti) |
a22cdf28930f
Lisätty bussipysäkkien ryhmittely
Teemu Piippo <teemu@hecknology.net>
parents:
7
diff
changeset
|
269 | if distance <= 0.3: |
a22cdf28930f
Lisätty bussipysäkkien ryhmittely
Teemu Piippo <teemu@hecknology.net>
parents:
7
diff
changeset
|
270 | possibilities.add((distance, cluster)) |
a22cdf28930f
Lisätty bussipysäkkien ryhmittely
Teemu Piippo <teemu@hecknology.net>
parents:
7
diff
changeset
|
271 | if possibilities: |
a22cdf28930f
Lisätty bussipysäkkien ryhmittely
Teemu Piippo <teemu@hecknology.net>
parents:
7
diff
changeset
|
272 | best = min(possibilities)[1] |
a22cdf28930f
Lisätty bussipysäkkien ryhmittely
Teemu Piippo <teemu@hecknology.net>
parents:
7
diff
changeset
|
273 | all_clusters.remove(bus_stop.cluster) |
a22cdf28930f
Lisätty bussipysäkkien ryhmittely
Teemu Piippo <teemu@hecknology.net>
parents:
7
diff
changeset
|
274 | best.merge(bus_stop.cluster) |
a22cdf28930f
Lisätty bussipysäkkien ryhmittely
Teemu Piippo <teemu@hecknology.net>
parents:
7
diff
changeset
|
275 | |
a22cdf28930f
Lisätty bussipysäkkien ryhmittely
Teemu Piippo <teemu@hecknology.net>
parents:
7
diff
changeset
|
276 | def shared_elements_in_n_sets(sets): |
a22cdf28930f
Lisätty bussipysäkkien ryhmittely
Teemu Piippo <teemu@hecknology.net>
parents:
7
diff
changeset
|
277 | from itertools import combinations |
a22cdf28930f
Lisätty bussipysäkkien ryhmittely
Teemu Piippo <teemu@hecknology.net>
parents:
7
diff
changeset
|
278 | result = set() |
a22cdf28930f
Lisätty bussipysäkkien ryhmittely
Teemu Piippo <teemu@hecknology.net>
parents:
7
diff
changeset
|
279 | for pair in combinations(sets, 2): |
a22cdf28930f
Lisätty bussipysäkkien ryhmittely
Teemu Piippo <teemu@hecknology.net>
parents:
7
diff
changeset
|
280 | result |= pair[0] & pair[1] |
a22cdf28930f
Lisätty bussipysäkkien ryhmittely
Teemu Piippo <teemu@hecknology.net>
parents:
7
diff
changeset
|
281 | return result |
a22cdf28930f
Lisätty bussipysäkkien ryhmittely
Teemu Piippo <teemu@hecknology.net>
parents:
7
diff
changeset
|
282 | |
a22cdf28930f
Lisätty bussipysäkkien ryhmittely
Teemu Piippo <teemu@hecknology.net>
parents:
7
diff
changeset
|
283 | def name_clusters(): |
a22cdf28930f
Lisätty bussipysäkkien ryhmittely
Teemu Piippo <teemu@hecknology.net>
parents:
7
diff
changeset
|
284 | from collections import defaultdict |
a22cdf28930f
Lisätty bussipysäkkien ryhmittely
Teemu Piippo <teemu@hecknology.net>
parents:
7
diff
changeset
|
285 | from pprint import pprint |
a22cdf28930f
Lisätty bussipysäkkien ryhmittely
Teemu Piippo <teemu@hecknology.net>
parents:
7
diff
changeset
|
286 | clusters_per_name = defaultdict(set) |
a22cdf28930f
Lisätty bussipysäkkien ryhmittely
Teemu Piippo <teemu@hecknology.net>
parents:
7
diff
changeset
|
287 | for cluster in all_clusters: |
a22cdf28930f
Lisätty bussipysäkkien ryhmittely
Teemu Piippo <teemu@hecknology.net>
parents:
7
diff
changeset
|
288 | name_representing_stop = min((len(pysäkki.tunniste), pysäkki.tunniste, pysäkki) for pysäkki in cluster.stops)[2] |
a22cdf28930f
Lisätty bussipysäkkien ryhmittely
Teemu Piippo <teemu@hecknology.net>
parents:
7
diff
changeset
|
289 | name = name_representing_stop.nimi.lower().replace(' ', '-') |
a22cdf28930f
Lisätty bussipysäkkien ryhmittely
Teemu Piippo <teemu@hecknology.net>
parents:
7
diff
changeset
|
290 | clusters_per_name[name].add(cluster) |
a22cdf28930f
Lisätty bussipysäkkien ryhmittely
Teemu Piippo <teemu@hecknology.net>
parents:
7
diff
changeset
|
291 | for name, clusters in clusters_per_name.items(): |
a22cdf28930f
Lisätty bussipysäkkien ryhmittely
Teemu Piippo <teemu@hecknology.net>
parents:
7
diff
changeset
|
292 | if len(clusters) == 1: |
a22cdf28930f
Lisätty bussipysäkkien ryhmittely
Teemu Piippo <teemu@hecknology.net>
parents:
7
diff
changeset
|
293 | # Ryhmä on ainoa jolla on varaus tälle nimelle. Sen kuin vaan. |
a22cdf28930f
Lisätty bussipysäkkien ryhmittely
Teemu Piippo <teemu@hecknology.net>
parents:
7
diff
changeset
|
294 | next(iter(clusters)).name = name |
a22cdf28930f
Lisätty bussipysäkkien ryhmittely
Teemu Piippo <teemu@hecknology.net>
parents:
7
diff
changeset
|
295 | else: |
a22cdf28930f
Lisätty bussipysäkkien ryhmittely
Teemu Piippo <teemu@hecknology.net>
parents:
7
diff
changeset
|
296 | # Olisiko kaikki klusterit eri alueilla? |
a22cdf28930f
Lisätty bussipysäkkien ryhmittely
Teemu Piippo <teemu@hecknology.net>
parents:
7
diff
changeset
|
297 | common_regions = shared_elements_in_n_sets({stop.alue for stop in cluster.stops} for cluster in clusters) |
a22cdf28930f
Lisätty bussipysäkkien ryhmittely
Teemu Piippo <teemu@hecknology.net>
parents:
7
diff
changeset
|
298 | # Esitys: ryhmä -> ne alueet jotka ovat tälle ryhmälle ainutlaatuisia |
a22cdf28930f
Lisätty bussipysäkkien ryhmittely
Teemu Piippo <teemu@hecknology.net>
parents:
7
diff
changeset
|
299 | proposal = { |
a22cdf28930f
Lisätty bussipysäkkien ryhmittely
Teemu Piippo <teemu@hecknology.net>
parents:
7
diff
changeset
|
300 | cluster: {stop.alue for stop in cluster.stops} - common_regions - {None} |
a22cdf28930f
Lisätty bussipysäkkien ryhmittely
Teemu Piippo <teemu@hecknology.net>
parents:
7
diff
changeset
|
301 | for cluster in clusters |
a22cdf28930f
Lisätty bussipysäkkien ryhmittely
Teemu Piippo <teemu@hecknology.net>
parents:
7
diff
changeset
|
302 | } |
a22cdf28930f
Lisätty bussipysäkkien ryhmittely
Teemu Piippo <teemu@hecknology.net>
parents:
7
diff
changeset
|
303 | # Jos enintään yksi klusteri tässä esityksessä on kokonaan ilman omaa aluetta, jolla se voisi eritellä, |
a22cdf28930f
Lisätty bussipysäkkien ryhmittely
Teemu Piippo <teemu@hecknology.net>
parents:
7
diff
changeset
|
304 | # niin nimetään klusterit näiden alueiden mukaan. |
a22cdf28930f
Lisätty bussipysäkkien ryhmittely
Teemu Piippo <teemu@hecknology.net>
parents:
7
diff
changeset
|
305 | # Se klusteri jolla ei ole omaa aluetta (jos on) jätetään ilman aluepäätettä. |
a22cdf28930f
Lisätty bussipysäkkien ryhmittely
Teemu Piippo <teemu@hecknology.net>
parents:
7
diff
changeset
|
306 | if sum([1 for unique_areas in proposal.values() if not unique_areas]) <= 1: |
a22cdf28930f
Lisätty bussipysäkkien ryhmittely
Teemu Piippo <teemu@hecknology.net>
parents:
7
diff
changeset
|
307 | for cluster, unique_areas in proposal.items(): |
a22cdf28930f
Lisätty bussipysäkkien ryhmittely
Teemu Piippo <teemu@hecknology.net>
parents:
7
diff
changeset
|
308 | individual_cluster_name = name |
a22cdf28930f
Lisätty bussipysäkkien ryhmittely
Teemu Piippo <teemu@hecknology.net>
parents:
7
diff
changeset
|
309 | if unique_areas: |
a22cdf28930f
Lisätty bussipysäkkien ryhmittely
Teemu Piippo <teemu@hecknology.net>
parents:
7
diff
changeset
|
310 | individual_cluster_name += '-' + min(unique_areas).lower().replace(' ', '-') |
a22cdf28930f
Lisätty bussipysäkkien ryhmittely
Teemu Piippo <teemu@hecknology.net>
parents:
7
diff
changeset
|
311 | cluster.name = individual_cluster_name |
a22cdf28930f
Lisätty bussipysäkkien ryhmittely
Teemu Piippo <teemu@hecknology.net>
parents:
7
diff
changeset
|
312 | else: |
a22cdf28930f
Lisätty bussipysäkkien ryhmittely
Teemu Piippo <teemu@hecknology.net>
parents:
7
diff
changeset
|
313 | # Typerä reunatapaus. Indeksoidaan numeroin... |
a22cdf28930f
Lisätty bussipysäkkien ryhmittely
Teemu Piippo <teemu@hecknology.net>
parents:
7
diff
changeset
|
314 | for n, (_, cluster) in enumerate(sorted( |
a22cdf28930f
Lisätty bussipysäkkien ryhmittely
Teemu Piippo <teemu@hecknology.net>
parents:
7
diff
changeset
|
315 | min((stop.tunniste.lower(), cluster) for stop in cluster.stops) |
a22cdf28930f
Lisätty bussipysäkkien ryhmittely
Teemu Piippo <teemu@hecknology.net>
parents:
7
diff
changeset
|
316 | for cluster in clusters |
a22cdf28930f
Lisätty bussipysäkkien ryhmittely
Teemu Piippo <teemu@hecknology.net>
parents:
7
diff
changeset
|
317 | ), 1): |
a22cdf28930f
Lisätty bussipysäkkien ryhmittely
Teemu Piippo <teemu@hecknology.net>
parents:
7
diff
changeset
|
318 | individual_cluster_name = name + '-' + str(n) |
a22cdf28930f
Lisätty bussipysäkkien ryhmittely
Teemu Piippo <teemu@hecknology.net>
parents:
7
diff
changeset
|
319 | cluster.name = individual_cluster_name |
a22cdf28930f
Lisätty bussipysäkkien ryhmittely
Teemu Piippo <teemu@hecknology.net>
parents:
7
diff
changeset
|
320 | |
a22cdf28930f
Lisätty bussipysäkkien ryhmittely
Teemu Piippo <teemu@hecknology.net>
parents:
7
diff
changeset
|
321 | print('Ryhmitellään pysäkit...') |
a22cdf28930f
Lisätty bussipysäkkien ryhmittely
Teemu Piippo <teemu@hecknology.net>
parents:
7
diff
changeset
|
322 | cluster_bus_stops() |
a22cdf28930f
Lisätty bussipysäkkien ryhmittely
Teemu Piippo <teemu@hecknology.net>
parents:
7
diff
changeset
|
323 | name_clusters() |
a22cdf28930f
Lisätty bussipysäkkien ryhmittely
Teemu Piippo <teemu@hecknology.net>
parents:
7
diff
changeset
|
324 | |
2 | 325 | print('Ladataan aikataulut... ', end = '', flush = True, file = stderr) |
0 | 326 | with open('gtfs/stop_times.txt') as file: |
327 | rivimäärä = sum(line.count('\n') for line in file) | |
328 | laskettu = 0 | |
329 | file.seek(0) | |
330 | for rivi in lue_csv(file): | |
331 | ajo = ajot[muunna_ajovuoro_tunniste(rivi['trip_id'])] | |
332 | saapumisaika = lue_aika(rivi['arrival_time']) | |
333 | lähtöaika = lue_aika(rivi['departure_time']) | |
334 | pysäkki = pysäkit[rivi['stop_id']] | |
335 | ajo.reitti.append(Pysähdys(saapumisaika, lähtöaika, pysäkki, ajo)) | |
336 | laskettu += 1 | |
337 | if laskettu % 1000 == 0: | |
2 | 338 | print('\rLadataan aikataulut... %.1f%%' % (laskettu * 100 / rivimäärä), end = ' ', file = stderr) |
4 | 339 | print('\rLadataan aikataulut... ladattu', file = stderr) |