Webstrukturmining ist der Prozess der Verwendung von Graphen- und Netzwerk-Mining-Theorie und -Methoden, um die Knoten und Verbindungsstrukturen im Web zu analysieren. Es extrahiert Muster aus Hyperlinks, wobei ein Hyperlink eine strukturelle Komponente ist, die eine Webseite mit einem anderen Speicherort verbindet. Es kann auch die Dokumentstruktur innerhalb einer Seite verminen (z. B. analysieren Sie die baumartige Struktur von Seitenstrukturen, um die Verwendung von HTML oder XML-Tags zu beschreiben). Beide Arten von Webstruktur-Mining helfen uns, Web-Inhalte zu verstehen und können auch dazu beitragen, Web-Inhalte in relativ strukturierte Datensätze umzuwandeln. Geo-Location-Daten aus sozialen Medien bieten uns Informationen, auf neue Weise, um die Einstellungen und Interessen der Menschen durch ihre Aktivitätsentscheidungen zu verstehen. In diesem Beitrag untersuchen wir die Idee, individuelle Lebensstilmuster aus Aktivitäten-Standort-Entscheidungen zu leiten, die in sozialen Medien aufgedeckt werden. Wir präsentieren ein Modell, um Lebensstilmuster anhand der kontextbezogenen Informationen (z.B. Standortkategorien) von User Check-Ins zu verstehen.




Probabilistische Themenmodelle werden entwickelt, um individuelle Geo-Life-Style-Muster aus zwei Perspektiven abzuleiten: i) die Muster von Nutzerinteressen zu verschiedenen Arten von Orten zu charakterisieren und ii) die Muster von Benutzerbesuchen in verschiedenen Stadtteilen zu charakterisieren. Die Methode wird auf ein Dataset von Foursquare-Check-Ins der Benutzer aus New York City angewendet. Die Koexistenz mehrerer Standortkontexte und die entsprechenden Wahrscheinlichkeiten in einem gegebenen Muster liefern nützliche Informationen über Benutzerinteressen und -optionen. Es wird festgestellt, dass Geo-Lebensstil-Muster ähnliche Elemente aufweisen – entweder in der Nähe von Nachbarschaften oder ähnlichen Standortkategorien. Die semantische und geografische Nähe der Elemente in einem Muster spiegelt die verborgene Regelmäßigkeit in den Benutzereinstellungen und dem Verhalten der Standortauswahl wider. Die Position des Gens auf dem p- oder q-Arm. Die Position eines Gens basiert auf einem unverwechselbaren Muster von hellen und dunklen Bändern, die auftreten, wenn das Chromosom in einer bestimmten Weise gefärbt wird. Die Position wird in der Regel durch zwei Ziffern (die einen Bereich und ein Band darstellen) bezeichnet, denen manchmal ein Dezimalkomma und eine oder mehrere zusätzliche Ziffern folgen (die Unterbänder innerhalb eines hellen oder dunklen Bereichs darstellen).