{"id":619,"date":"2019-10-24T00:00:35","date_gmt":"2019-10-24T04:00:35","guid":{"rendered":"http:\/\/portfolio-pre.uqac.ca\/vincentarnaud\/?p=619"},"modified":"2024-07-16T05:34:51","modified_gmt":"2024-07-16T09:34:51","slug":"uqac-et-google-trends-une-exploration","status":"publish","type":"post","link":"https:\/\/portfolio.uqac.ca\/vincentarnaud\/uqac-et-google-trends-une-exploration\/","title":{"rendered":"UQAC et <em>Google Trends<\/em> : une premi\u00e8re exploration"},"content":{"rendered":"<h1>1. Introduction<\/h1>\n<p><a href=\"https:\/\/trends.google.com\/trends\"><code>Google Trends<\/code><\/a> est un outil offert gratuitement par la multinationale <code>Google<\/code> permettant d\u2019\u00e9valuer la popularit\u00e9 d\u2019un ou plusieurs termes de recherche utilis\u00e9(s) par les internautes dans le moteur de recherche \u00e9ponyme.<\/p>\n<p>Les donn\u00e9es propos\u00e9es par cet outil peuvent \u00eatre t\u00e9l\u00e9charg\u00e9es sous l\u2019interface du logiciel <code>R<\/code> \u00e0 l\u2019aide de la biblioth\u00e8que <code>gtrendsR<\/code>. La base de donn\u00e9es produite contient notamment le nombre de <code>hits<\/code> mensuels portant sur le ou les termes recherch\u00e9s. L\u2019indice de popularit\u00e9 appel\u00e9 <code>hits<\/code> n\u2019indique pas un nombre de recherches absolu, mais une proportion entre 0 et 100, o\u00f9 100 repr\u00e9sente la quantit\u00e9 maximale d\u2019utilisation du terme dans le mois et la zone g\u00e9ographique \u00e9ventuellement circonscrite.<\/p>\n<p><code>Google Trends<\/code> n\u2019a pas pour vocation \u00e0 fournir le volume d\u2019une recherche, mais permet seulement de visualiser l\u2019\u00e9volution de sa popularit\u00e9.<\/p>\n<p>Les donn\u00e9es de <code>Google Trends<\/code> sont disponibles mensuellement depuis 2004.<\/p>\n<p><strong>Dans le cadre de cette exploration, nous nous int\u00e9resserons \u00e0 l\u2019\u00e9volution de la popularit\u00e9 de l\u2019acronyme de l\u2019Universit\u00e9 du Qu\u00e9bec \u00e0 Chicoutimi <code>UQAC<\/code> dans les requ\u00eates des internautes.<\/strong><\/p>\n<p>La fonctionnalit\u00e9 de cet outil qui vise \u00e0 d\u00e9terminer la position g\u00e9ographique de l\u2019internaute effectuant la requ\u00eate a \u00e9t\u00e9 am\u00e9lior\u00e9e \u00e0 partir du 1<sup>er<\/sup>janvier 2011. La collecte des donn\u00e9es a, pour sa part, \u00e9t\u00e9 am\u00e9lior\u00e9e \u00e0 partir du 1<sup>er<\/sup> janvier 2016. Les r\u00e9sultats suivants sont donc \u00e0 interpr\u00e9ter avec prudence.<\/p>\n<h1>2. Description g\u00e9n\u00e9rale des tendances<\/h1>\n<pre class=\"sourceCode r\"><code class=\"sourceCode r\">tendances &lt;- <span class=\"kw\">gtrends<\/span>(<span class=\"dt\">keyword =<\/span> <span class=\"kw\">c<\/span>(<span class=\"st\">\"UQAC\"<\/span>),\r\n              <span class=\"dt\">time =<\/span> <span class=\"st\">\"2004-01-02 2019-09-30\"<\/span>,\r\n              <span class=\"dt\">gprop =<\/span> <span class=\"st\">\"web\"<\/span>,\r\n              <span class=\"dt\">low_search_volume=<\/span><span class=\"ot\">TRUE<\/span>)<\/code><\/pre>\n<p>Les donn\u00e9es utilis\u00e9es pour d\u00e9terminer la popularit\u00e9 relative du terme <code>UQAC<\/code> dans les requ\u00eates des internautes s\u2019\u00e9chelonnent du 1<sup>er<\/sup> f\u00e9vrier 2004 au 30 septembre 2019. Aucune restriction g\u00e9ographique n\u2019a \u00e9t\u00e9 effectu\u00e9e. Les donn\u00e9es r\u00e9colt\u00e9es ne sont donc pas circonscrites \u00e0 un pays ou une r\u00e9gion donn\u00e9e. Cette collecte comprend aussi les r\u00e9sultats pour les zones g\u00e9ographiques de faible volume.<\/p>\n<p>Comme indiqu\u00e9 par <a href=\"https:\/\/medium.com\/google-news-lab\/what-is-google-trends-data-and-what-does-it-mean-b48f07342ee8\">Simon Rogers<\/a> (<em>Data journalist<\/em> et <em>Data Editor<\/em> chez Google) en 2016 :<\/p>\n<blockquote><p>&#8220;There are two ways to filter the Trends data: real time and non-real time. Real time is a random sample of searches from the last seven days, while non-real time is another random sample of the full Google dataset that can go back anywhere from 2004 to ~36 hours ago. The charts will show you either one or the other, but not both together, because these are two separate random samples. We take a sample of the trillions of Google searches, because it would otherwise be too large to process quickly. By sampling our data, we can look at a dataset representative of all Google searches, while finding insights that can be processed within minutes of an event happening in the real world.&#8221;<\/p><\/blockquote>\n<p>Les donn\u00e9es r\u00e9colt\u00e9es sont extraites d\u2019un \u00e9chantillon al\u00e9atoire archiv\u00e9 des trillions de requ\u00eates soumises par les internautes \u00e0 ce moteur de recherche.<code><\/code> L\u2019it\u00e9ration de cette analyse serait donc susceptible de fournir des donn\u00e9es et donc des r\u00e9sultats l\u00e9g\u00e8rement diff\u00e9rents.<\/p>\n<p><img loading=\"lazy\" decoding=\"async\" class=\"alignright size-full wp-image-684\" src=\"https:\/\/portfolio.uqac.ca\/vincentarnaud\/files\/2019\/10\/unnamed-chunk-6-1.png\" alt=\"\" width=\"5400\" height=\"3600\" srcset=\"https:\/\/portfolio.uqac.ca\/vincentarnaud\/files\/2019\/10\/unnamed-chunk-6-1.png 5400w, https:\/\/portfolio.uqac.ca\/vincentarnaud\/files\/2019\/10\/unnamed-chunk-6-1-150x100.png 150w, https:\/\/portfolio.uqac.ca\/vincentarnaud\/files\/2019\/10\/unnamed-chunk-6-1-300x200.png 300w, https:\/\/portfolio.uqac.ca\/vincentarnaud\/files\/2019\/10\/unnamed-chunk-6-1-768x512.png 768w, https:\/\/portfolio.uqac.ca\/vincentarnaud\/files\/2019\/10\/unnamed-chunk-6-1-1024x683.png 1024w\" sizes=\"(max-width: 5400px) 100vw, 5400px\" \/><\/p>\n<p>\u00c0 priori, il semble que le nombre de <code>hits<\/code> du terme <code>UQAC<\/code> diminue au cours du temps, passant, en moyenne, de 74 de 2004 \u00e0 2007, \u00e0 45 entre 2017 et 2018. Le nombre de <code>hits<\/code> du terme <code>UQAC<\/code> semble \u00e0 nouveau \u00e0 la hausse en 2019.<\/p>\n<p>\u00c0 ces r\u00e9sultats mensuels, a \u00e9t\u00e9 ajout\u00e9e une courbe de lissage par r\u00e9gression locale (<em>Locally Weighted Scatterplot Smoother<\/em>). Ce type de r\u00e9gression dite <em>loess<\/em> (ou <em>lowess<\/em>) repose sur la technique des <em>k<\/em> plus proches voisins (KNN). Cette courbe tend \u00e0 confirmer cette tendance g\u00e9n\u00e9rale.<\/p>\n<p>Cette repr\u00e9sentation exploratoire met \u00e9galement en lumi\u00e8re une possible composante saisonni\u00e8re dans cette s\u00e9rie temporelle.<\/p>\n<p>D\u2019ann\u00e9e en ann\u00e9e, les mois de juin, juillet et d\u00e9cembre, qui correspondent aux p\u00e9riodes de vacances, semblent pr\u00e9senter un nombre inf\u00e9rieur de requ\u00eates. \u00c0 l\u2019inverse, les mois d\u2019ao\u00fbt\/septembre et de janvier, qui correspondent, eux, aux p\u00e9riodes de rentr\u00e9e, semblent pr\u00e9senter une hausse r\u00e9currente du nombre de <code>hits<\/code> du terme <code>UQAC<\/code>.<\/p>\n<p>En bref, en explorant ces donn\u00e9es on note une double tendance non lin\u00e9aire du nombre du <code>hits<\/code> : une tendance g\u00e9n\u00e9rale \u00e0 la d\u00e9croissance, une saisonnalit\u00e9 annuelle.<\/p>\n<h1>3. Une mod\u00e9lisation de cette s\u00e9rie temporelle<\/h1>\n<p>La mod\u00e9lisation d\u2019une s\u00e9rie temporelle vise \u00e0 choisir un mod\u00e8le qui d\u00e9crit au mieux les donn\u00e9es collect\u00e9es. Une mod\u00e9lisation doit \u00eatre \u00e0 m\u00eame d\u2019extraire une structure du signal :<\/p>\n<ul>\n<li>en supprimant le bruit, les erreurs de mesure ou les fluctuations al\u00e9atoires non explicables ;<\/li>\n<li>en recherchant la pr\u00e9sence d\u2019une tendance et \u00e9ventuellement d\u2019une saisonnalit\u00e9 dans les donn\u00e9es.<\/li>\n<\/ul>\n<h2>3.1 Les mod\u00e8les additifs g\u00e9n\u00e9ralis\u00e9s (GAM)<\/h2>\n<p>Afin de confirmer statistiquement les informations exploratoires, nous avons choisi d\u2019utiliser un mod\u00e8le additif g\u00e9n\u00e9ralis\u00e9.<\/p>\n<p>Les mod\u00e8les additifs g\u00e9n\u00e9ralis\u00e9s (<em>Generalized additive models<\/em>) s\u2019av\u00e8rent pertinents lorsque la relation entre un pr\u00e9dicteur continu (ici le temps) et une variable d\u00e9pendante (ici le nombre de <code>hits<\/code>) n\u2019est pas d\u00e9crite ad\u00e9quatement par une r\u00e9gression lin\u00e9aire (Wood, 2017).<\/p>\n<p>Une r\u00e9gression lin\u00e9aire ne permet pas de saisir la nature non lin\u00e9aire d\u2019une trajectoire temporelle par exemple. De telles divergences entre les donn\u00e9es et le mod\u00e8le cr\u00e9ent des patrons dans la repr\u00e9sentation des r\u00e9sidus (un r\u00e9sidu est la diff\u00e9rence entre la valeur pr\u00e9dite par un mod\u00e8le et la valeur r\u00e9elle de la variable d\u00e9pendante), ce qui rend les intervalles de confiance et les valeurs p non fiables (S\u00f3skuthy, 2017). L\u2019utilisation d\u2019une r\u00e9gression lin\u00e9aire pour d\u00e9crire une relation non lin\u00e9aire entre un pr\u00e9dicteur et une variable d\u00e9pendante est donc un choix dangereux. Les GAM permettent de faire fi de cette difficult\u00e9 en utilisant des fonctions de lissage (<em>smoothers<\/em>) non param\u00e9triques appliqu\u00e9es \u00e0 un ou plusieurs pr\u00e9dicteurs qui peuvent, bien entendu, \u00eatre accompagn\u00e9s de covariables param\u00e9triques <em>classiques<\/em>.<\/p>\n<p>La fonction de lissage par d\u00e9faut d\u2019un GAM est un <em>thin plate spline<\/em> (Spline en plaque mince), mais de nombreuses autres fonctions de lissage adapt\u00e9es \u00e0 diff\u00e9rentes situations (notamment la cyclicit\u00e9 d&#8217;un ph\u00e9nom\u00e8ne) sont aussi disponibles (<em>cubic regression spline, cyclic spline, penalised spline<\/em>\u2026)<\/p>\n<blockquote><p>\u201cWhile the differences between all these smoothers are beyond the scope of this article, it matters to say that the so-called penalization aims at finding the best value for the smoothing parameter, which controls the amount of smoothing, i.e., the degree of fitting of the smooth term to the raw predictor(s), unless this degree is specified externally by the user. The effective degrees of freedom (edf) can be referred to describe the amount of smoothing. The goal is here to avoid both underfitting and overfitting \u2013 the bias\/variance tradeoff, so that the model can generalize well to data other than the sample used to build it.\u201d \u2014 Coup\u00e9 (2018 : 8)<\/p><\/blockquote>\n<h2>3.2 Un mod\u00e8le parcimonieux<\/h2>\n<h3>3.2.1 La parcimonie d\u2019un mod\u00e8le<\/h3>\n<p>Une propri\u00e9t\u00e9 de base d\u2019un mod\u00e8le statistique de qualit\u00e9 est qu\u2019il est \u00e0 m\u00eame d\u2019expliquer convenablement les donn\u00e9es tout en \u00e9liminant les d\u00e9tails et les erreurs. De tels mod\u00e8les sont appel\u00e9s \u00ab parcimonieux \u00bb. En recourant \u00e0 la m\u00e9trique de l\u2019AIC (<em>Akaike\u2019s Information Criterion<\/em>), nous avons cherch\u00e9 \u00e0 mettre au jour le mod\u00e8le parcimonieux et donc \u00e0 s\u00e9lectionner :<\/p>\n<ul>\n<li>les variables ind\u00e9pendantes importantes ;<\/li>\n<li>les <em>smoothers<\/em> les plus appropri\u00e9s.<\/li>\n<\/ul>\n<blockquote><p>\u201cThe AIC: value is a corrected version of the deviance that has the additional benefit that it can be compared across models (for the same data set and response variable) with different numbers of predictors.\u201d \u2014 Speelman (2014: 510)<\/p><\/blockquote>\n<p>Il n\u2019existe pas de th\u00e9orie statistique permettant d\u2019\u00e9tablir un seuil de signification strict (une valeur p) pour l\u2019utilisation de l\u2019AIC. La s\u00e9lection du mod\u00e8le parcimonieux se fait alors en identifiant le mod\u00e8le ayant la plus petite valeur d\u2019AIC. G\u00e9n\u00e9ralement, si les mod\u00e8les se trouvent \u00e0 moins de 2 unit\u00e9s AIC l\u2019un de l\u2019autre, ils sont tr\u00e8s similaires. S\u2019ils ont plus de 10 unit\u00e9s de diff\u00e9rence entre les deux mod\u00e8les, ils sont tr\u00e8s diff\u00e9rents et il est important de consid\u00e9rer le mod\u00e8le ayant la plus petite valeur d\u2019AIC.<\/p>\n<p>Dans le cadre de cette premi\u00e8re exploration,, trois fonctions de lissage sont test\u00e9es : <em>thin plate spline<\/em> (<code>tp<\/code>) (par d\u00e9faut), <em>cubic regression spline<\/em> (<code>cr<\/code>) et <em>cyclic cubic regression spline<\/em> (<code>cc<\/code>) (bien adapt\u00e9e aux \u00e9v\u00e8nements cycliques comme les variations mensuelles).<\/p>\n<p>Le nombre de noeuds (<em>knots<\/em>) est en lien avec les lieux de changement de direction de la courbe de lissage. Le nombre de noeuds d\u00e9pend de la taille de l\u2019\u00e9chantillon et du nombre d\u2019observations par variable liss\u00e9e. Plus il y a de noeuds et plus la fonction de lissage va se montrer <em>sautillante<\/em> (<em>wiggly<\/em>) et tenter de suivre parfaitement l\u2019\u00e9volution temporelle des donn\u00e9es au risque d\u2019\u00eatre sur-ajust\u00e9e. D\u00e9terminer le nombre optimal de noeuds est donc important pour mettre au point un mod\u00e8le parcimonieux.<\/p>\n<p>Pour la variable <code>mois<\/code>, le nombre maximal de noeuds est fix\u00e9 \u00e0 12 (le nombre de mois dans une ann\u00e9e) et pour la variable <code>annee<\/code>, il est fix\u00e9 \u00e0 16 (soit le nombre d\u2019ann\u00e9es couvertes dans cet \u00e9chantillon).<\/p>\n<h3>3.2.2 Mod\u00e8les \u00e9valu\u00e9s<\/h3>\n<p>Diff\u00e9rents mod\u00e8les sont compar\u00e9s ci-dessous afin d\u2019\u00e9tablir un mod\u00e8le parcimonieux.<\/p>\n<pre class=\"sourceCode r\"><code class=\"sourceCode r\">modele1 &lt;- <span class=\"kw\">gam<\/span>(hits <span class=\"op\">~<\/span>\r\n             <span class=\"kw\">s<\/span>(mois, <span class=\"dt\">k=<\/span><span class=\"dv\">12<\/span>, <span class=\"dt\">bs=<\/span><span class=\"st\">\"tp\"<\/span>)\r\n             <span class=\"op\">+<\/span> <span class=\"kw\">s<\/span>(annee, <span class=\"dt\">k=<\/span><span class=\"dv\">16<\/span>, <span class=\"dt\">bs=<\/span><span class=\"st\">\"tp\"<\/span>),\r\n             <span class=\"dt\">method =<\/span> <span class=\"st\">\"GCV.Cp\"<\/span>,\r\n             <span class=\"dt\">data=<\/span>tendances.df,\r\n             <span class=\"dt\">family =<\/span> <span class=\"st\">\"poisson\"<\/span>,\r\n             <span class=\"dt\">select=<\/span>T\r\n             )<\/code><\/pre>\n<pre class=\"sourceCode r\"><code class=\"sourceCode r\">modele2 &lt;- <span class=\"kw\">gam<\/span>(hits <span class=\"op\">~<\/span>\r\n             <span class=\"kw\">s<\/span>(mois, <span class=\"dt\">k=<\/span><span class=\"dv\">12<\/span>, <span class=\"dt\">bs=<\/span><span class=\"st\">\"cc\"<\/span>)\r\n             <span class=\"op\">+<\/span> <span class=\"kw\">s<\/span>(annee, <span class=\"dt\">k=<\/span><span class=\"dv\">16<\/span>, <span class=\"dt\">bs=<\/span><span class=\"st\">\"tp\"<\/span>),\r\n             <span class=\"dt\">method =<\/span> <span class=\"st\">\"GCV.Cp\"<\/span>,\r\n             <span class=\"dt\">data=<\/span>tendances.df,\r\n             <span class=\"dt\">family =<\/span> <span class=\"st\">\"poisson\"<\/span>,\r\n             <span class=\"dt\">select=<\/span>T\r\n             )<\/code><\/pre>\n<pre class=\"sourceCode r\"><code class=\"sourceCode r\">modele3 &lt;- <span class=\"kw\">gam<\/span>(hits <span class=\"op\">~<\/span>\r\n             <span class=\"kw\">s<\/span>(mois, <span class=\"dt\">k=<\/span><span class=\"dv\">12<\/span>, <span class=\"dt\">bs=<\/span><span class=\"st\">\"cc\"<\/span>)\r\n             <span class=\"op\">+<\/span> <span class=\"kw\">s<\/span>(annee, <span class=\"dt\">k=<\/span><span class=\"dv\">16<\/span>, <span class=\"dt\">bs=<\/span><span class=\"st\">\"cr\"<\/span>),\r\n             <span class=\"dt\">method =<\/span> <span class=\"st\">\"GCV.Cp\"<\/span>,\r\n             <span class=\"dt\">data=<\/span>tendances.df,\r\n             <span class=\"dt\">family =<\/span> <span class=\"st\">\"poisson\"<\/span>,\r\n             <span class=\"dt\">select=<\/span>T\r\n             )<\/code><\/pre>\n<h3>3.2.3 Comparaison par AIC<\/h3>\n<p>La comparaison de ces mod\u00e8les en fonction de leur valeur d\u2019AIC sugg\u00e8re que le <code>mod\u00e8le1<\/code> est le plus parcimonieux. Il va de soi que la diff\u00e9rence entre le <code>modele2<\/code> et le <code>modele3<\/code> est minime.<\/p>\n<pre><code>              df      AIC\r\nmodele1 17.08252 1259.162\r\nmodele2 16.79017 1276.164\r\nmodele3 16.77871 1276.146<\/code><\/pre>\n<h3>3.2.4 R\u00e9sum\u00e9 du mod\u00e8le choisi<\/h3>\n<pre><code>\r\nFamily: poisson \r\nLink function: log \r\n\r\nFormula:\r\nhits ~ s(mois, k = 12, bs = \"tp\") + s(annee, k = 16, bs = \"tp\")\r\n\r\nParametric coefficients:\r\n            Estimate Std. Error z value Pr(&gt;|z|)    \r\n(Intercept) 4.113751   0.009563   430.2   &lt;2e-16 ***\r\n---\r\nSignif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1\r\n\r\nApproximate significance of smooth terms:\r\n            edf Ref.df Chi.sq p-value    \r\ns(mois)  10.307     11  496.2  &lt;2e-16 ***\r\ns(annee)  5.775     15  374.7  &lt;2e-16 ***\r\n---\r\nSignif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1\r\n\r\nR-sq.(adj) =  0.881   Deviance explained = 90.2%\r\nUBRE = -0.25036  Scale est. = 1         n = 188<\/code><\/pre>\n<p>La fonction de lien indiqu\u00e9e dans le r\u00e9sum\u00e9 du mod\u00e8le associe les pr\u00e9dictions d\u2019un mod\u00e8le sur l\u2019\u00e9chelle de r\u00e9ponse \u00e0 celles sur l\u2019\u00e9chelle du pr\u00e9dicteur lin\u00e9aire. Les donn\u00e9es de comptage (ici les <code>hits<\/code>) sont des valeurs enti\u00e8res strictement non n\u00e9gatives et sont mod\u00e9lis\u00e9es par un GAM utilisant une distribution de Poisson et une fonction de lien <code>log<\/code>. Sur l\u2019\u00e9chelle logarithmique, la r\u00e9ponse peut prendre n\u2019importe quelle valeur r\u00e9elle entre &#8211;<span class=\"math inline\"><span id=\"MathJax-Element-1-Frame\" class=\"MathJax\" style=\"font-family: 'DejaVu Sans Condensed';font-style: normal;font-weight: normal;line-height: normal;font-size: 14px;text-indent: 0px;text-align: left;letter-spacing: normal;float: none;direction: ltr;max-width: none;max-height: none;min-width: 0px;min-height: 0px;border: 0px;padding: 0px;margin: 0px\"><span id=\"MathJax-Span-1\" class=\"math\"><span id=\"MathJax-Span-2\" class=\"mrow\"><span id=\"MathJax-Span-3\" class=\"mi\">\u221e<\/span><\/span><\/span><\/span><\/span> et +<span class=\"math inline\"><span id=\"MathJax-Element-2-Frame\" class=\"MathJax\" style=\"font-family: 'DejaVu Sans Condensed';font-style: normal;font-weight: normal;line-height: normal;font-size: 14px;text-indent: 0px;text-align: left;letter-spacing: normal;float: none;direction: ltr;max-width: none;max-height: none;min-width: 0px;min-height: 0px;border: 0px;padding: 0px;margin: 0px\"><span id=\"MathJax-Span-4\" class=\"math\"><span id=\"MathJax-Span-5\" class=\"mrow\"><span id=\"MathJax-Span-6\" class=\"mi\">\u221e<\/span><\/span><\/span><\/span><\/span>, et c\u2019est sur cette \u00e9chelle que l\u2019ajustement du mod\u00e8le est effectu\u00e9. Cependant, nous devons faire correspondre ces valeurs \u00e0 l\u2019\u00e9chelle de r\u00e9ponse, qui, elle, est non n\u00e9gative. L\u2019inverse de la fonction de lien, soit ici la fonction exponentielle est alors utilis\u00e9e pour r\u00e9\u00e9chelonner les valeurs pr\u00e9dites par le mod\u00e8le sur l\u2019intervalle 0 +<span class=\"math inline\"><span id=\"MathJax-Element-3-Frame\" class=\"MathJax\" style=\"font-family: 'DejaVu Sans Condensed';font-style: normal;font-weight: normal;line-height: normal;font-size: 14px;text-indent: 0px;text-align: left;letter-spacing: normal;float: none;direction: ltr;max-width: none;max-height: none;min-width: 0px;min-height: 0px;border: 0px;padding: 0px;margin: 0px\"><span id=\"MathJax-Span-7\" class=\"math\"><span id=\"MathJax-Span-8\" class=\"mrow\"><span id=\"MathJax-Span-9\" class=\"mi\">\u221e<\/span><\/span><\/span><\/span><\/span>.<\/p>\n<p>D\u2019apr\u00e8s les informations fournies dans ce r\u00e9sum\u00e9, les effets des deux effets fixes continus liss\u00e9s <code>mois<\/code> et <code>annee<\/code> sont significatifs. Puisque les niveaux de significativit\u00e9 statistique propos\u00e9s dans ce r\u00e9sum\u00e9 sont des approximations, il est important que le mod\u00e8le soit v\u00e9rifi\u00e9.<\/p>\n<h2>3.3 Quelques diagnostics de base<\/h2>\n<p><img loading=\"lazy\" decoding=\"async\" class=\"alignright size-full wp-image-673\" src=\"https:\/\/portfolio.uqac.ca\/vincentarnaud\/files\/2019\/10\/unnamed-chunk-12-1.png\" alt=\"\" width=\"5400\" height=\"3600\" srcset=\"https:\/\/portfolio.uqac.ca\/vincentarnaud\/files\/2019\/10\/unnamed-chunk-12-1.png 5400w, https:\/\/portfolio.uqac.ca\/vincentarnaud\/files\/2019\/10\/unnamed-chunk-12-1-150x100.png 150w, https:\/\/portfolio.uqac.ca\/vincentarnaud\/files\/2019\/10\/unnamed-chunk-12-1-300x200.png 300w, https:\/\/portfolio.uqac.ca\/vincentarnaud\/files\/2019\/10\/unnamed-chunk-12-1-768x512.png 768w, https:\/\/portfolio.uqac.ca\/vincentarnaud\/files\/2019\/10\/unnamed-chunk-12-1-1024x683.png 1024w\" sizes=\"(max-width: 5400px) 100vw, 5400px\" \/><\/p>\n<pre><code>\r\nMethod: UBRE   Optimizer: outer newton\r\nfull convergence after 18 iterations.\r\nGradient range [-4.546141e-10,4.212817e-09]\r\n(score -0.2503571 &amp; scale 1).\r\neigenvalue range [-4.212816e-09,0.005652646].\r\nModel rank =  27 \/ 27 \r\n\r\nBasis dimension (k) checking results. Low p-value (k-index&lt;1) may\r\nindicate that k is too low, especially if edf is close to k'.\r\n\r\n            k'   edf k-index p-value\r\ns(mois)  11.00 10.31    1.15    0.98\r\ns(annee) 15.00  5.78    0.97    0.34<\/code><\/pre>\n<p>Les graphiques pr\u00e9c\u00e9dents n\u2019indiquent aucune probl\u00e9matique majeure li\u00e9e \u00e0 :<\/p>\n<ul>\n<li>la lin\u00e9arit\u00e9 et \u00e0 la normalit\u00e9 des r\u00e9sidus,<\/li>\n<li>l\u2019homog\u00e9n\u00e9it\u00e9 de la variance.<\/li>\n<\/ul>\n<p>Il est aussi fait \u00e9tat d\u2019une convergence r\u00e9ussie de l\u2019optimisation <code>outer newton<\/code>. Les valeurs de <code>k<\/code> utilis\u00e9es pour ajuster les fonctions de lissage semblent adapt\u00e9es (<code>k-index<\/code>\u22481) avec des valeurs p non significatives.<\/p>\n<p>La concurvit\u00e9 (l\u2019\u00e9quivalent non param\u00e9trique de la colin\u00e9arit\u00e9) se produit lorsqu\u2019un effet fixe liss\u00e9 peut \u00eatre approxim\u00e9 par un ou plusieurs autres effets fixes liss\u00e9s pr\u00e9sents dans le mod\u00e8le. Plus sa valeur est proche de 1, plus il y a de risques que le mod\u00e8le soit difficilement interpr\u00e9table ou que les estim\u00e9s soient instables. Ici, les valeurs de concurvit\u00e9 sont proches de z\u00e9ro.<\/p>\n<pre><code>                 para      s(mois)    s(annee)\r\nworst    2.796979e-24 0.0161916883 0.016191688\r\nobserved 2.796979e-24 0.0007729336 0.003212910\r\nestimate 2.796979e-24 0.0090339654 0.002737686<\/code><\/pre>\n<h2>3.4 \u00c0 propos de l\u2019autocorr\u00e9lation des r\u00e9sidus<\/h2>\n<p>L\u2019une des hypoth\u00e8ses qui sous-tendent les mod\u00e8les de r\u00e9gression lin\u00e9aire est que les r\u00e9sidus ne sont pas corr\u00e9l\u00e9s, cela signifie que le r\u00e9sidu d\u2019une observation n\u2019affecte pas le r\u00e9sidu d\u2019une autre observation. On dit alors que les r\u00e9sidus sont ind\u00e9pendants.<\/p>\n<p>Cependant, quand on analyse une s\u00e9rie temporelle avec un GAM, il peut y avoir une corr\u00e9lation entre les r\u00e9sidus si la mesure d\u2019un ph\u00e9nom\u00e8ne \u00e0 un instant t<span id=\"MathJax-Element-4-Frame\" class=\"MathJax\" style=\"font-family: 'DejaVu Sans Condensed';font-style: normal;font-weight: normal;line-height: normal;font-size: 14px;text-indent: 0px;text-align: left;letter-spacing: normal;float: none;direction: ltr;max-width: none;max-height: none;min-width: 0px;min-height: 0px;border: 0px;padding: 0px;margin: 0px\"><span id=\"MathJax-Span-10\" class=\"math\"><span id=\"MathJax-Span-11\" class=\"mrow\"><span id=\"MathJax-Span-12\" class=\"mi\"><\/span><\/span><\/span><\/span> est corr\u00e9l\u00e9e aux mesures pr\u00e9c\u00e9dentes (au temps <span class=\"math inline\"><span id=\"MathJax-Element-5-Frame\" class=\"MathJax\" style=\"font-family: 'DejaVu Sans Condensed';font-style: normal;font-weight: normal;line-height: normal;font-size: 14px;text-indent: 0px;text-align: left;letter-spacing: normal;float: none;direction: ltr;max-width: none;max-height: none;min-width: 0px;min-height: 0px;border: 0px;padding: 0px;margin: 0px\"><span id=\"MathJax-Span-13\" class=\"math\"><span id=\"MathJax-Span-14\" class=\"mrow\"><span id=\"MathJax-Span-15\" class=\"mi\">t<\/span><span id=\"MathJax-Span-16\" class=\"mo\">\u2212<\/span><span id=\"MathJax-Span-17\" class=\"mn\">1, t<span id=\"MathJax-Span-16\" class=\"mo\">\u2212<\/span>n)<\/span><\/span><\/span><\/span><\/span> ou aux mesures suivantes (\u00e0 <span class=\"math inline\"><span id=\"MathJax-Element-7-Frame\" class=\"MathJax\" style=\"font-family: 'DejaVu Sans Condensed';font-style: normal;font-weight: normal;line-height: normal;font-size: 14px;text-indent: 0px;text-align: left;letter-spacing: normal;float: none;direction: ltr;max-width: none;max-height: none;min-width: 0px;min-height: 0px;border: 0px;padding: 0px;margin: 0px\"><span id=\"MathJax-Span-23\" class=\"math\"><span id=\"MathJax-Span-24\" class=\"mrow\"><span id=\"MathJax-Span-25\" class=\"mi\">t<\/span><span id=\"MathJax-Span-26\" class=\"mo\">+<\/span><span id=\"MathJax-Span-27\" class=\"mn\">1,<\/span><\/span><\/span><\/span><\/span> t+n).<span id=\"MathJax-Element-8-Frame\" class=\"MathJax\" style=\"font-family: 'DejaVu Sans Condensed';font-style: normal;font-weight: normal;line-height: normal;font-size: 14px;text-indent: 0px;text-align: left;letter-spacing: normal;float: none;direction: ltr;max-width: none;max-height: none;min-width: 0px;min-height: 0px;border: 0px;padding: 0px;margin: 0px\"><span id=\"MathJax-Span-28\" class=\"math\"><span id=\"MathJax-Span-29\" class=\"mrow\"><span id=\"MathJax-Span-30\" class=\"mi\"><\/span><span id=\"MathJax-Span-31\" class=\"mo\"><\/span><span id=\"MathJax-Span-32\" class=\"mi\"><\/span><\/span><\/span><\/span><\/p>\n<p>Cette d\u00e9pendance temporelle des r\u00e9sidus est appel\u00e9e l\u2019autocorr\u00e9lation des r\u00e9sidus d\u2019une s\u00e9rie temporelle. Une s\u00e9rie autocorr\u00e9l\u00e9e est ainsi corr\u00e9l\u00e9e \u00e0 elle-m\u00eame, avec un d\u00e9calage (<em>lag<\/em>) donn\u00e9.<\/p>\n<p>On peut calculer l\u2019autocorr\u00e9lation des r\u00e9sidus d\u2019une s\u00e9rie temporelle pour diff\u00e9rents d\u00e9calages.<\/p>\n<p>La fonction d\u2019autocorr\u00e9lation (ACF) des r\u00e9sidus peut \u00eatre calcul\u00e9e et repr\u00e9sent\u00e9e sous la forme d\u2019un corr\u00e9logramme.<\/p>\n<p><img loading=\"lazy\" decoding=\"async\" class=\"alignright size-full wp-image-674\" src=\"https:\/\/portfolio.uqac.ca\/vincentarnaud\/files\/2019\/10\/unnamed-chunk-14-1.png\" alt=\"\" width=\"5400\" height=\"3600\" srcset=\"https:\/\/portfolio.uqac.ca\/vincentarnaud\/files\/2019\/10\/unnamed-chunk-14-1.png 5400w, https:\/\/portfolio.uqac.ca\/vincentarnaud\/files\/2019\/10\/unnamed-chunk-14-1-150x100.png 150w, https:\/\/portfolio.uqac.ca\/vincentarnaud\/files\/2019\/10\/unnamed-chunk-14-1-300x200.png 300w, https:\/\/portfolio.uqac.ca\/vincentarnaud\/files\/2019\/10\/unnamed-chunk-14-1-768x512.png 768w, https:\/\/portfolio.uqac.ca\/vincentarnaud\/files\/2019\/10\/unnamed-chunk-14-1-1024x683.png 1024w\" sizes=\"(max-width: 5400px) 100vw, 5400px\" \/><\/p>\n<p>Sur la figure suivante, seuls les 50 premiers d\u00e9calages sont repr\u00e9sent\u00e9s.<\/p>\n<p><img loading=\"lazy\" decoding=\"async\" class=\"alignright size-full wp-image-675\" src=\"https:\/\/portfolio.uqac.ca\/vincentarnaud\/files\/2019\/10\/unnamed-chunk-15-1.png\" alt=\"\" width=\"5400\" height=\"3600\" srcset=\"https:\/\/portfolio.uqac.ca\/vincentarnaud\/files\/2019\/10\/unnamed-chunk-15-1.png 5400w, https:\/\/portfolio.uqac.ca\/vincentarnaud\/files\/2019\/10\/unnamed-chunk-15-1-150x100.png 150w, https:\/\/portfolio.uqac.ca\/vincentarnaud\/files\/2019\/10\/unnamed-chunk-15-1-300x200.png 300w, https:\/\/portfolio.uqac.ca\/vincentarnaud\/files\/2019\/10\/unnamed-chunk-15-1-768x512.png 768w, https:\/\/portfolio.uqac.ca\/vincentarnaud\/files\/2019\/10\/unnamed-chunk-15-1-1024x683.png 1024w\" sizes=\"(max-width: 5400px) 100vw, 5400px\" \/><\/p>\n<p>Sur un corr\u00e9logramme :<\/p>\n<ul>\n<li>le d\u00e9calage pour lequel l\u2019autocorr\u00e9lation est calcul\u00e9e est indiqu\u00e9 sur l\u2019axe des abscisses ;<\/li>\n<li>la valeur de la corr\u00e9lation (entre -1 et 1) est indiqu\u00e9e sur l\u2019axe des ordonn\u00e9es ;<\/li>\n<li>les droites horizontales pointill\u00e9es indiquent les seuils critiques au-del\u00e0 desquels l\u2019autocorr\u00e9lation est consid\u00e9r\u00e9e comme significative \u00e0 95 %.<\/li>\n<\/ul>\n<p>Le pic au d\u00e9calage 0 sur un trac\u00e9 de l\u2019ACF indique une corr\u00e9lation positive parfaite (1) entre une observation de la s\u00e9rie et elle-m\u00eame (forc\u00e9ment !). Quelques rares pics de diff\u00e9rents d\u00e9calages exc\u00e8dent les seuils critiques entre chaque observation et l\u2019observation apparaissant <span class=\"math inline\"><span id=\"MathJax-Element-9-Frame\" class=\"MathJax\" style=\"font-family: 'DejaVu Sans Condensed';font-style: normal;font-weight: normal;line-height: normal;font-size: 14px;text-indent: 0px;text-align: left;letter-spacing: normal;float: none;direction: ltr;max-width: none;max-height: none;min-width: 0px;min-height: 0px;border: 0px;padding: 0px;margin: 0px\"><span id=\"MathJax-Span-33\" class=\"math\"><span id=\"MathJax-Span-34\" class=\"mrow\"><span id=\"MathJax-Span-35\" class=\"mi\">x<\/span><\/span><\/span><span class=\"MJX_Assistive_MathML\">x<\/span><\/span><\/span> mois avant ou <span class=\"math inline\"><span id=\"MathJax-Element-10-Frame\" class=\"MathJax\" style=\"font-family: 'DejaVu Sans Condensed';font-style: normal;font-weight: normal;line-height: normal;font-size: 14px;text-indent: 0px;text-align: left;letter-spacing: normal;float: none;direction: ltr;max-width: none;max-height: none;min-width: 0px;min-height: 0px;border: 0px;padding: 0px;margin: 0px\"><span id=\"MathJax-Span-36\" class=\"math\"><span id=\"MathJax-Span-37\" class=\"mrow\"><span id=\"MathJax-Span-38\" class=\"mi\">x<\/span><\/span><\/span><span class=\"MJX_Assistive_MathML\">x<\/span><\/span><\/span> mois apr\u00e8s parmi les 188.<\/p>\n<p>Cependant, le corr\u00e9logramme partiel n\u2019illustre pas de corr\u00e9lation particuli\u00e8rement importante des r\u00e9sidus pour les 50 premiers d\u00e9calages.<\/p>\n<p><img loading=\"lazy\" decoding=\"async\" class=\"alignright size-full wp-image-676\" src=\"https:\/\/portfolio.uqac.ca\/vincentarnaud\/files\/2019\/10\/unnamed-chunk-16-1.png\" alt=\"\" width=\"5400\" height=\"3600\" srcset=\"https:\/\/portfolio.uqac.ca\/vincentarnaud\/files\/2019\/10\/unnamed-chunk-16-1.png 5400w, https:\/\/portfolio.uqac.ca\/vincentarnaud\/files\/2019\/10\/unnamed-chunk-16-1-150x100.png 150w, https:\/\/portfolio.uqac.ca\/vincentarnaud\/files\/2019\/10\/unnamed-chunk-16-1-300x200.png 300w, https:\/\/portfolio.uqac.ca\/vincentarnaud\/files\/2019\/10\/unnamed-chunk-16-1-768x512.png 768w, https:\/\/portfolio.uqac.ca\/vincentarnaud\/files\/2019\/10\/unnamed-chunk-16-1-1024x683.png 1024w\" sizes=\"(max-width: 5400px) 100vw, 5400px\" \/><\/p>\n<p>Les autocorr\u00e9lations repr\u00e9sent\u00e9es ci-dessus sont empiriques et calcul\u00e9es \u00e0 partir d\u2019un \u00e9chantillon de taille modeste (188 observations).<\/p>\n<blockquote><p>Quelques valeurs ACF sont en dehors des intervalles de confiance ce qui sugg\u00e8re une autocorr\u00e9lation des r\u00e9sidus. Cependant, dans la cadre de cette premi\u00e8re exploration, cette autocorr\u00e9lation n&#8217;a pas \u00e9t\u00e9 consid\u00e9r\u00e9e.<\/p><\/blockquote>\n<h2>3.5 Deux effets significatifs<\/h2>\n<p>Le nombre de <code>hits<\/code> du terme <code>UQAC<\/code> peut donc \u00eatre expliqu\u00e9 par les deux effets fixes liss\u00e9s <code>mois<\/code> et <code>annee<\/code> de fa\u00e7on statistiquement significative.<\/p>\n<pre><code>  smooth.term                        report\r\n1     s(mois) Chi.sq(10.307)=496.23; p&lt;.001\r\n2    s(annee)  Chi.sq(5.775)=374.68; p&lt;.001<\/code><\/pre>\n<p>Le graphique suivant met en lumi\u00e8re un sommet du nombre de <code>hits<\/code> du terme <code>UQAC<\/code> en 2006-2007, et ce, quel que soit le mois consid\u00e9r\u00e9. \u00c0 l\u2019inverse, 2013 marque le d\u00e9but de la d\u00e9croissance du terme <code>UQAC<\/code>. 2018 et 2019 sont les ann\u00e9es au cours desquelles le terme <code>UQAC<\/code> a \u00e9t\u00e9 le moins utilis\u00e9 par les internautes dans leurs recherches sur le moteur de <code>Google<\/code>.<\/p>\n<p>Ce graphique illustre aussi la relative stabilit\u00e9 de la popularit\u00e9 du terme <code>UQAC<\/code> entre janvier et avril et entre septembre et d\u00e9cembre et la chute du nombre de <code>hits<\/code> de cette requ\u00eate entre mai et ao\u00fbt, et ce, pour chacune des ann\u00e9es entre 2004 et 2019. Depuis les ann\u00e9es 2006-2007, les habitudes de consommation de l\u2019information num\u00e9rique ont chang\u00e9 et les supports de diffusion se sont diversifi\u00e9s (<em>Facebook<\/em>, <em>Twitter<\/em>, <em>YouTube<\/em>\u2026), cette d\u00e9croissance des requ\u00eates du terme <code>UQAC<\/code> peut \u00eatre li\u00e9e \u00e0 cette diversification.<\/p>\n<p><img loading=\"lazy\" decoding=\"async\" class=\"alignright size-full wp-image-677\" src=\"https:\/\/portfolio.uqac.ca\/vincentarnaud\/files\/2019\/10\/unnamed-chunk-18-1.png\" alt=\"\" width=\"5400\" height=\"3600\" srcset=\"https:\/\/portfolio.uqac.ca\/vincentarnaud\/files\/2019\/10\/unnamed-chunk-18-1.png 5400w, https:\/\/portfolio.uqac.ca\/vincentarnaud\/files\/2019\/10\/unnamed-chunk-18-1-150x100.png 150w, https:\/\/portfolio.uqac.ca\/vincentarnaud\/files\/2019\/10\/unnamed-chunk-18-1-300x200.png 300w, https:\/\/portfolio.uqac.ca\/vincentarnaud\/files\/2019\/10\/unnamed-chunk-18-1-768x512.png 768w, https:\/\/portfolio.uqac.ca\/vincentarnaud\/files\/2019\/10\/unnamed-chunk-18-1-1024x683.png 1024w\" sizes=\"(max-width: 5400px) 100vw, 5400px\" \/><\/p>\n<p>Ce second graphique, pendant du pr\u00e9c\u00e9dent, rend compte des m\u00eames tendances et notamment la chute drastique du nombre de <code>hits<\/code> durant les mois de juin et juillet de chacune des ann\u00e9es de cet \u00e9chantillon, mais aussi le nombre de requ\u00eates le plus \u00e9lev\u00e9 du terme <code>UQAC<\/code> ont lieu durant le mois de janvier de chacune de ces ann\u00e9es.<\/p>\n<p><img loading=\"lazy\" decoding=\"async\" class=\"alignright size-full wp-image-678\" src=\"https:\/\/portfolio.uqac.ca\/vincentarnaud\/files\/2019\/10\/unnamed-chunk-19-1.png\" alt=\"\" width=\"5400\" height=\"3600\" srcset=\"https:\/\/portfolio.uqac.ca\/vincentarnaud\/files\/2019\/10\/unnamed-chunk-19-1.png 5400w, https:\/\/portfolio.uqac.ca\/vincentarnaud\/files\/2019\/10\/unnamed-chunk-19-1-150x100.png 150w, https:\/\/portfolio.uqac.ca\/vincentarnaud\/files\/2019\/10\/unnamed-chunk-19-1-300x200.png 300w, https:\/\/portfolio.uqac.ca\/vincentarnaud\/files\/2019\/10\/unnamed-chunk-19-1-768x512.png 768w, https:\/\/portfolio.uqac.ca\/vincentarnaud\/files\/2019\/10\/unnamed-chunk-19-1-1024x683.png 1024w\" sizes=\"(max-width: 5400px) 100vw, 5400px\" \/><\/p>\n<p>Il est aussi possible de visualiser en 3D la surface des valeurs pr\u00e9dites en fonction des deux effets fixes liss\u00e9s <code>mois<\/code> et <code>annee<\/code>.<\/p>\n<p><img loading=\"lazy\" decoding=\"async\" class=\"alignright size-full wp-image-688\" src=\"https:\/\/portfolio.uqac.ca\/vincentarnaud\/files\/2019\/10\/unnamed-chunk-20-1.png\" alt=\"\" width=\"5400\" height=\"3600\" srcset=\"https:\/\/portfolio.uqac.ca\/vincentarnaud\/files\/2019\/10\/unnamed-chunk-20-1.png 5400w, https:\/\/portfolio.uqac.ca\/vincentarnaud\/files\/2019\/10\/unnamed-chunk-20-1-150x100.png 150w, https:\/\/portfolio.uqac.ca\/vincentarnaud\/files\/2019\/10\/unnamed-chunk-20-1-300x200.png 300w, https:\/\/portfolio.uqac.ca\/vincentarnaud\/files\/2019\/10\/unnamed-chunk-20-1-768x512.png 768w, https:\/\/portfolio.uqac.ca\/vincentarnaud\/files\/2019\/10\/unnamed-chunk-20-1-1024x683.png 1024w\" sizes=\"(max-width: 5400px) 100vw, 5400px\" \/><\/p>\n<h2>3.6 Ajustement du mod\u00e8le<\/h2>\n<p>Le graphique suivant illustre l\u2019ajustement des pr\u00e9dictions du mod\u00e8le GAM aux donn\u00e9es collect\u00e9es. Rappelons qu\u2019un ajustement exact des pr\u00e9dictions de ce mod\u00e8le aux donn\u00e9es collect\u00e9es n\u2019est pas recherch\u00e9 : il est d\u2019ailleurs important d\u2019\u00e9viter tout sur-ajustement.<\/p>\n<p><img loading=\"lazy\" decoding=\"async\" class=\"alignright size-full wp-image-680\" src=\"https:\/\/portfolio.uqac.ca\/vincentarnaud\/files\/2019\/10\/unnamed-chunk-22-1.png\" alt=\"\" width=\"5400\" height=\"3600\" srcset=\"https:\/\/portfolio.uqac.ca\/vincentarnaud\/files\/2019\/10\/unnamed-chunk-22-1.png 5400w, https:\/\/portfolio.uqac.ca\/vincentarnaud\/files\/2019\/10\/unnamed-chunk-22-1-150x100.png 150w, https:\/\/portfolio.uqac.ca\/vincentarnaud\/files\/2019\/10\/unnamed-chunk-22-1-300x200.png 300w, https:\/\/portfolio.uqac.ca\/vincentarnaud\/files\/2019\/10\/unnamed-chunk-22-1-768x512.png 768w, https:\/\/portfolio.uqac.ca\/vincentarnaud\/files\/2019\/10\/unnamed-chunk-22-1-1024x683.png 1024w\" sizes=\"(max-width: 5400px) 100vw, 5400px\" \/><\/p>\n<p>L\u2019int\u00e9r\u00eat n\u2019est ici que d\u2019expliquer et mod\u00e9liser la structure de la s\u00e9rie temporelle. Cette mod\u00e9lisation n\u2019a pas pour objectif de pr\u00e9voir les valeurs futures de cette s\u00e9rie temporelle.<\/p>\n<h1>4. Requ\u00eates associ\u00e9es<\/h1>\n<p>Les internautes ayant recherch\u00e9 le terme <code>UQAC<\/code> ont \u00e9galement effectu\u00e9 d\u2019autres requ\u00eates. <code>Google Trends<\/code> offre la possibilit\u00e9 de r\u00e9colter les plus fr\u00e9quentes requ\u00eates associ\u00e9es au terme <code>UQAC<\/code> utilis\u00e9es par les internautes durant la p\u00e9riode de 2004 \u00e0 2019 tout en fournissant \u00e9galement l\u2019indice de popularit\u00e9 (le nombre de <code>hits<\/code>) de chacune de ces requ\u00eates associ\u00e9es.<\/p>\n<pre><code>                   value keyword\r\n1        uqac chicoutimi    UQAC\r\n2             chicoutimi    UQAC\r\n3                 moodle    UQAC\r\n4            moodle uqac    UQAC\r\n5            uqac moodle    UQAC\r\n6            emploi uqac    UQAC\r\n7                   uqam    UQAC\r\n8  pavillon sportif uqac    UQAC\r\n9               saguenay    UQAC\r\n10         uqac \u00e9tudiant    UQAC\r\n11       uqac classiques    UQAC\r\n12                  uqtr    UQAC\r\n13     biblioth\u00e8que uqac    UQAC\r\n14          biblioth\u00e8que    UQAC\r\n15                  uqar    UQAC\r\n16 dossier \u00e9tudiant uqac    UQAC\r\n17                accesd    UQAC\r\n18 uqac dossier \u00e9tudiant    UQAC\r\n19          uqac portail    UQAC\r\n20 uqac dossier \u00e9tudiant    UQAC\r\n21                ulaval    UQAC\r\n22      dossier \u00e9tudiant    UQAC\r\n23      cegep chicoutimi    UQAC\r\n24      universit\u00e9 laval    UQAC\r\n25             mage uqac    UQAC<\/code><\/pre>\n<p>\u00c0 partir de la liste de ces requ\u00eates associ\u00e9es dont l\u2019orthographe a \u00e9t\u00e9 corrig\u00e9e (notamment les accents), il est , par exemple, possible de calculer la fr\u00e9quence des unigrammes et des bigrammes.<\/p>\n<h2>4.1 Fr\u00e9quence des unigrammes<\/h2>\n<p>Les unigrammes ou mots typographiques sont traditionnellement d\u00e9finis comme des cha\u00eenes de caract\u00e8res (<em>string<\/em>) comprises entre deux blancs typographiques ou entre un blanc typographique et un signe de ponctuation. Ils sont repr\u00e9sent\u00e9s ci-dessous sous la forme d\u2019un <em>nuage de mots<\/em> (<em>wordcloud<\/em>). La taille de chaque forme sur le graphique suivant indique son effectif.<\/p>\n<p><img loading=\"lazy\" decoding=\"async\" class=\"alignright size-full wp-image-681\" src=\"https:\/\/portfolio.uqac.ca\/vincentarnaud\/files\/2019\/10\/unnamed-chunk-25-1.png\" alt=\"\" width=\"5400\" height=\"3600\" srcset=\"https:\/\/portfolio.uqac.ca\/vincentarnaud\/files\/2019\/10\/unnamed-chunk-25-1.png 5400w, https:\/\/portfolio.uqac.ca\/vincentarnaud\/files\/2019\/10\/unnamed-chunk-25-1-150x100.png 150w, https:\/\/portfolio.uqac.ca\/vincentarnaud\/files\/2019\/10\/unnamed-chunk-25-1-300x200.png 300w, https:\/\/portfolio.uqac.ca\/vincentarnaud\/files\/2019\/10\/unnamed-chunk-25-1-768x512.png 768w, https:\/\/portfolio.uqac.ca\/vincentarnaud\/files\/2019\/10\/unnamed-chunk-25-1-1024x683.png 1024w\" sizes=\"(max-width: 5400px) 100vw, 5400px\" \/><\/p>\n<h2>4.2 Fr\u00e9quence des bigrammes<\/h2>\n<p>Les bigrammes sont les s\u00e9quences de deux termes apparaissant de fa\u00e7on contigu\u00eb dans les requ\u00eates associ\u00e9es.<\/p>\n<p>Il est possible de repr\u00e9senter ces bigrammes sous la forme de graphes. Ces derniers sont principalement utilis\u00e9s en math\u00e9matiques dans le cadre de la th\u00e9orie des graphes. Un graphe est un ensemble de sommets (ou de noeuds, <em>vertices<\/em> en anglais) reli\u00e9s deux \u00e0 deux \u00e0 deux par une ou plusieurs ar\u00eates (ou arcs, <em>edges<\/em> en anglais).<\/p>\n<p>Dans le graphe suivant, le degr\u00e9 de transparence repr\u00e9sente l\u2019effectif de chacun des bigrammes ainsi reli\u00e9s. Le sens de la fl\u00e8che rend compte de l\u2019ordre d\u2019apparition des termes dans chacun des bigrammes.<\/p>\n<p><img loading=\"lazy\" decoding=\"async\" class=\"alignright size-full wp-image-682\" src=\"https:\/\/portfolio.uqac.ca\/vincentarnaud\/files\/2019\/10\/unnamed-chunk-26-1.png\" alt=\"\" width=\"5400\" height=\"3600\" srcset=\"https:\/\/portfolio.uqac.ca\/vincentarnaud\/files\/2019\/10\/unnamed-chunk-26-1.png 5400w, https:\/\/portfolio.uqac.ca\/vincentarnaud\/files\/2019\/10\/unnamed-chunk-26-1-150x100.png 150w, https:\/\/portfolio.uqac.ca\/vincentarnaud\/files\/2019\/10\/unnamed-chunk-26-1-300x200.png 300w, https:\/\/portfolio.uqac.ca\/vincentarnaud\/files\/2019\/10\/unnamed-chunk-26-1-768x512.png 768w, https:\/\/portfolio.uqac.ca\/vincentarnaud\/files\/2019\/10\/unnamed-chunk-26-1-1024x683.png 1024w\" sizes=\"(max-width: 5400px) 100vw, 5400px\" \/><\/p>\n<h2>4.3 Interpr\u00e9tation sommaire<\/h2>\n<p>Le but n\u2019est pas ici d\u2019interpr\u00e9ter les r\u00e9sultats obtenus de fa\u00e7on d\u00e9taill\u00e9e, il est n\u00e9anmoins int\u00e9ressant de noter que les plus fr\u00e9quentes requ\u00eates associ\u00e9es au terme <code>UQAC<\/code> semblent concerner des aspects administratifs (<em>Dossier \u00e9tudiant<\/em>, <em>portail \u00e9tudiant<\/em>), financiers (<em>emploi UQAC<\/em>, <em>Acc\u00e8s D<\/em>) ou encore des liens g\u00e9n\u00e9raux vers la biblioth\u00e8que, le pavillon sportif, <em>Moodle<\/em>, le <em>MAGE-UQAC<\/em> (les associations \u00e9tudiantes). Ces requ\u00eates semblent t\u00e9moigner que le moteur de recherche de <code>Google<\/code> est majoritairement utilis\u00e9 par les internautes comme un moteur de recherche interne \u00e0 l\u2019institution pour localiser rapidement des ressources d\u2019usage r\u00e9gulier.<\/p>\n<p>La seule requ\u00eate populaire associ\u00e9e \u00e0 la recherche concerne les <a href=\"https:\/\/classiques.uqac.ca\/\">Classiques en sciences sociales<\/a>.<\/p>\n<p>De fa\u00e7on plus g\u00e9n\u00e9rale, il est \u00e9galement int\u00e9ressant de noter que les \u00e9tablissements d\u2019enseignement associ\u00e9s \u00e0 l\u2019UQAC dans cette n\u00e9buleuse lexicale sont le C\u00e9gep de Chicoutimi (exclusivement), l\u2019Universit\u00e9 Laval (sous deux d\u00e9nominations diff\u00e9rentes), l\u2019UQAR, l\u2019UQTR et l\u2019UQAM.<\/p>\n<h1>5. Origine g\u00e9ographique des internautes<\/h1>\n<p>Un dernier point, il semble \u00e9vident que tout internaute ne connaissant pas cette universit\u00e9 ne cherchera pas l\u2019acronyme <code>UQAC<\/code>, mais sa d\u00e9nomination compl\u00e8te.<\/p>\n<p>\u00c0 cet \u00e9gard, <code>Google Trends<\/code> offre la possibilit\u00e9 de colliger les zones g\u00e9ographiques o\u00f9 ce terme est populaire. On se rend ainsi rapidement compte que la requ\u00eate <code>UQAC<\/code> provient essentiellement de la r\u00e9gion du Saguenay\u2013Lac-Saint-Jean, mais aussi de la C\u00f4te-Nord, mais tr\u00e8s peu dans le reste du Qu\u00e9bec et du Canada.<\/p>\n<pre><code>             location hits\r\n1            Saguenay  100\r\n2                Alma   31\r\n3            Roberval   26\r\n4      Saint-F\u00e9licien   25\r\n5  Dolbeau-Mistassini   23\r\n6           Sept-Iles   16\r\n7         Baie-Comeau    7\r\n8         Qu\u00e9bec City    2\r\n9      Trois-Rivi\u00e8res    1\r\n10              Levis    1\r\n11           Montreal    1\r\n12         Sherbrooke    1\r\n13           Gatineau   &lt;1\r\n14              Laval   &lt;1\r\n15          Longueuil   &lt;1\r\n16              Dakar   &lt;1\r\n17             Ottawa   &lt;1\r\n18            Toronto   &lt;1\r\n19         Casablanca   &lt;1\r\n20              Paris   &lt;1<\/code><\/pre>\n<p>Il est cependant int\u00e9ressant de noter la relative popularit\u00e9 de cet acronyme en Guin\u00e9e et au S\u00e9n\u00e9gal, deux pays avec lesquels l\u2019UQAC a possiblement des accords.<\/p>\n<pre><code>  location hits\r\n1   Canada  100\r\n2  Senegal   50\r\n3   Guinea   23\r\n4  Tunisia    7\r\n5  Algeria    6\r\n6  Morocco    5\r\n7   France    4\r\n8      USA   &lt;1\r\n9   Russia   &lt;1<\/code><\/pre>\n<p><img loading=\"lazy\" decoding=\"async\" class=\"alignright size-full wp-image-683\" src=\"https:\/\/portfolio.uqac.ca\/vincentarnaud\/files\/2019\/10\/unnamed-chunk-29-1.png\" alt=\"\" width=\"5400\" height=\"3600\" srcset=\"https:\/\/portfolio.uqac.ca\/vincentarnaud\/files\/2019\/10\/unnamed-chunk-29-1.png 5400w, https:\/\/portfolio.uqac.ca\/vincentarnaud\/files\/2019\/10\/unnamed-chunk-29-1-150x100.png 150w, https:\/\/portfolio.uqac.ca\/vincentarnaud\/files\/2019\/10\/unnamed-chunk-29-1-300x200.png 300w, https:\/\/portfolio.uqac.ca\/vincentarnaud\/files\/2019\/10\/unnamed-chunk-29-1-768x512.png 768w, https:\/\/portfolio.uqac.ca\/vincentarnaud\/files\/2019\/10\/unnamed-chunk-29-1-1024x683.png 1024w\" sizes=\"(max-width: 5400px) 100vw, 5400px\" \/><\/p>\n<h1>6. R\u00e9f\u00e9rences<\/h1>\n<p>Coup\u00e9, C. (2018). Modeling linguistic variables with regression models: Addressing non-gaussian distributions, non-independent observations, and non-linear predictors with random effects and Generalized Additive Models for Location, Scale, and Shape. <em>Frontiers in Psychology<\/em>, 9. <a class=\"uri\" href=\"https:\/\/doi.org\/10.3389\/fpsyg.2018.00513\">https:\/\/doi.org\/10.3389\/fpsyg.2018.00513<\/a><\/p>\n<p>S\u00f3skuthy, M. (2017). Generalised additive mixed models for dynamic analysis in linguistics : A practical introduction.<a href=\"https:\/\/arxiv.org\/abs\/1703.05339\"> https:\/\/arxiv.org\/abs\/1703.05339<\/a><\/p>\n<p>Speelman, D. (2014). Logistic regression : A confirmatory technique for comparisons in corpus linguistics. In D. Glynn &amp; J. A. Robinson (\u00c9d.), <em>Human Cognitive Processing<\/em> (Vol. 43, p. 487\u2011533). Amsterdam: Benjamins.<\/p>\n<p>Wood, S. N. (2017). <em>Generalized additive models : An introduction with <code>R<\/code><\/em> (2nd ed.). Boca Raton: CRC Press.<\/p>\n<h1>7. Environnement<\/h1>\n<p>R version 3.6.1 (2019-07-05)<br \/>\nPlateforme : x86_64-w64-mingw32\/x64 (64-bit)<br \/>\nVersion du syst\u00e8me d\u2019exploitation : Windows 10 x64 (build 15063)<\/p>\n<h1>8. Biblioth\u00e8ques utilis\u00e9es<\/h1>\n<p><code><\/code><code>stats<\/code>: <em>The R Stats Package<\/em> version 3.6.1<br \/>\n<code>graphics<\/code>: <em>The R Graphics Package<\/em> version 3.6.1<br \/>\n<code>grDevices<\/code>: <em>The R Graphics Devices and Support for Colours and Fonts<\/em> version 3.6.1<br \/>\n<code>utils<\/code>: <em>The R Utils Package<\/em> version 3.6.1<br \/>\n<code>datasets<\/code>: <em>The R Datasets Package<\/em> version 3.6.1<br \/>\n<code>methods<\/code>: <em>Formal Methods and Classes<\/em> version 3.6.1<br \/>\n<code>base<\/code>: <em>The R Base Package<\/em> version 3.6.1<br \/>\n<code>mapproj<\/code>: <em>Map Projections<\/em> version 1.2.6<br \/>\n<code>maps<\/code>: <em>Draw Geographical Maps<\/em> version 3.3.0<br \/>\n<code>extrafont<\/code>: <em>Tools for using fonts<\/em> version 0.17<br \/>\n<code>ggwordcloud<\/code>: <em>A Word Cloud Geom for \u2018ggplot2\u2019<\/em> version 0.5.0<br \/>\n<code>ggraph<\/code>: <em>An Implementation of Grammar of Graphics for Graphs and Networks<\/em> version 2.0.0<br \/>\n<code>igraph<\/code>: <em>Network Analysis and Visualization<\/em> version 1.2.4.1<br \/>\n<code>stringr<\/code>: <em>Simple, Consistent Wrappers for Common String Operations<\/em> version 1.4.0<br \/>\n<code>tidytext<\/code>: <em>Text Mining using \u2018dplyr\u2019, \u2018ggplot2\u2019, and Other Tidy Tools<\/em> version 0.2.2<br \/>\n<code>tidyr<\/code>: <em>Tidy Messy Data<\/em> version 1.0.0<br \/>\n<code>itsadug<\/code>: <em>Interpreting Time Series and Autocorrelated Data Using GAMMs<\/em> version 2.3<br \/>\n<code>plotfunctions<\/code>: <em>Various Functions to Facilitate Visualization of Data and Analysis<\/em> version 1.3<br \/>\n<code>sjPlot<\/code>: <em>Data Visualization for Statistics in Social Science<\/em> version 2.7.2<br \/>\n<code>mgcv<\/code>: <em>Mixed GAM Computation Vehicle with Automatic Smoothness Estimation<\/em> version 1.8-28<br \/>\n<code>nlme<\/code>: <em>Linear and Nonlinear Mixed Effects Models<\/em> version 3.1-140<br \/>\n<code>lubridate<\/code>: <em>Make Dealing with Dates a Little Easier<\/em> version 1.7.4<br \/>\n<code>gtrendsR<\/code>: <em>Perform and Display Google Trends Queries<\/em> version 1.4.4<br \/>\n<code>ggplot2<\/code>: <em>Create Elegant Data Visualisations Using the Grammar of Graphics<\/em> version 3.2.1<\/p>\n","protected":false},"excerpt":{"rendered":"<p>1. Introduction Google Trends est un outil offert gratuitement par la multinationale Google permettant d\u2019\u00e9valuer la popularit\u00e9 d\u2019un ou plusieurs termes de recherche utilis\u00e9(s) par les internautes dans le moteur de recherche \u00e9ponyme. Les donn\u00e9es propos\u00e9es par cet outil peuvent \u00eatre t\u00e9l\u00e9charg\u00e9es sous l\u2019interface du logiciel R \u00e0 l\u2019aide de la biblioth\u00e8que gtrendsR. La base &hellip; <a href=\"https:\/\/portfolio.uqac.ca\/vincentarnaud\/uqac-et-google-trends-une-exploration\/\" class=\"more-link\">Continuer la lecture de <span class=\"screen-reader-text\">UQAC et <em>Google Trends<\/em> : une premi\u00e8re exploration<\/span>  <span class=\"meta-nav\">&rarr;<\/span><\/a><\/p>\n","protected":false},"author":129,"featured_media":0,"comment_status":"closed","ping_status":"closed","sticky":false,"template":"","format":"standard","meta":{"footnotes":""},"categories":[1],"tags":[],"_links":{"self":[{"href":"https:\/\/portfolio.uqac.ca\/vincentarnaud\/wp-json\/wp\/v2\/posts\/619"}],"collection":[{"href":"https:\/\/portfolio.uqac.ca\/vincentarnaud\/wp-json\/wp\/v2\/posts"}],"about":[{"href":"https:\/\/portfolio.uqac.ca\/vincentarnaud\/wp-json\/wp\/v2\/types\/post"}],"author":[{"embeddable":true,"href":"https:\/\/portfolio.uqac.ca\/vincentarnaud\/wp-json\/wp\/v2\/users\/129"}],"replies":[{"embeddable":true,"href":"https:\/\/portfolio.uqac.ca\/vincentarnaud\/wp-json\/wp\/v2\/comments?post=619"}],"version-history":[{"count":30,"href":"https:\/\/portfolio.uqac.ca\/vincentarnaud\/wp-json\/wp\/v2\/posts\/619\/revisions"}],"predecessor-version":[{"id":787,"href":"https:\/\/portfolio.uqac.ca\/vincentarnaud\/wp-json\/wp\/v2\/posts\/619\/revisions\/787"}],"wp:attachment":[{"href":"https:\/\/portfolio.uqac.ca\/vincentarnaud\/wp-json\/wp\/v2\/media?parent=619"}],"wp:term":[{"taxonomy":"category","embeddable":true,"href":"https:\/\/portfolio.uqac.ca\/vincentarnaud\/wp-json\/wp\/v2\/categories?post=619"},{"taxonomy":"post_tag","embeddable":true,"href":"https:\/\/portfolio.uqac.ca\/vincentarnaud\/wp-json\/wp\/v2\/tags?post=619"}],"curies":[{"name":"wp","href":"https:\/\/api.w.org\/{rel}","templated":true}]}}