Développement et application d'un modèle de capteur logiciel de régression forestière aléatoire pour le traitement des eaux usées domestiques dans un réacteur séquentiel discontinu

Rapports scientifiques volume 13, Numéro d'article : 9149 (2023) Citer cet article

149 accès

Détails des métriques

Les équipements de traitement de l'eau distribués à petite échelle tels que les réacteurs discontinus séquentiels (SBR) sont largement utilisés dans le domaine du traitement des eaux usées domestiques en milieu rural en raison de ses avantages d'installation et de construction rapides, de son faible coût d'exploitation et de sa forte adaptabilité. Cependant, en raison des caractéristiques de non-linéarité et d'hystérésis dans le procédé SBR, il est difficile de construire le modèle de simulation du traitement des eaux usées. Dans cette étude, une méthodologie a été développée en utilisant l'intelligence artificielle et un système de contrôle automatique qui peut économiser l'énergie correspondant à la réduction des émissions de carbone. La méthodologie s'appuie sur un modèle de forêt aléatoire pour déterminer un capteur logiciel approprié pour la prédiction des tendances de la COD. Cette étude utilise des capteurs de pH et de température comme locaux pour les capteurs de DCO. Dans la méthode proposée, les données ont été prétraitées en 12 variables d'entrée et les 7 principales variables ont été sélectionnées comme variables du modèle optimisé. Cycle terminé par l'intelligence artificielle et le système de contrôle automatique au lieu d'un contrôle à temps fixe qui était un scénario non contrôlé. Dans 12 cas de test, le pourcentage d'élimination de la DCO est d'environ 91,075 % tandis que 24,25 % de temps ou d'énergie ont été économisés d'un point de vue moyen. Cette méthodologie de sélection de capteurs souples proposée peut être appliquée dans le domaine du traitement des eaux usées domestiques rurales avec des avantages d'économie de temps et d'énergie. Le gain de temps se traduit par une augmentation de la capacité de traitement et les économies d'énergie représentent une technologie à faible émission de carbone. La méthodologie proposée fournit un cadre pour étudier les moyens de réduire les coûts associés à la collecte de données en remplaçant les capteurs coûteux et peu fiables par des alternatives abordables et fiables. En adoptant cette approche, la conservation de l'énergie peut être maintenue tout en respectant les normes d'émission.

Les eaux usées domestiques rurales se caractérisent par une qualité et une quantité d'eau instables, des rejets dispersés et une faible concentration de polluants1. Pour relever ces défis, les équipements de traitement de l'eau distribués à petite échelle sont devenus largement utilisés dans le domaine du traitement des eaux usées domestiques en milieu rural en raison de leur installation et de leur construction rapides, de leur faible coût d'exploitation et de leur forte adaptabilité2. Au cours des dernières années, le procédé de réacteur discontinu séquentiel (SBR) est apparu comme une option prometteuse pour le traitement des eaux usées domestiques en milieu rural. Comparé à d'autres procédés, le SBR peut résister efficacement aux impacts de la charge organique, a des modes de fonctionnement flexibles, produit de bons effets d'effluent et permet d'obtenir de meilleurs effets d'élimination de l'azote et du phosphore3,4,5,6.

Cependant, la construction de modèles de simulation précis pour le traitement des eaux usées domestiques rurales peut être difficile en raison des caractéristiques de non-linéarité et d'hystérésis présentées par le processus SBR7,8. Les problèmes non linéaires dans le traitement des eaux usées font référence aux relations complexes, diverses et non linéaires qui découlent des interactions de diverses réactions chimiques, réactions biologiques et effets physiques pendant le traitement des eaux usées.

L'intelligence artificielle, y compris l'apprentissage automatique, a été appliquée aux processus de traitement des eaux usées pour résoudre efficacement les problèmes non linéaires. L'apprentissage automatique englobe une gamme de méthodes, telles que les réseaux de neurones et la régression vectorielle de support, qui peuvent être utilisées pour analyser et modéliser les données complexes générées lors du traitement des eaux usées. Cela a effectivement amélioré l'efficacité et la qualité du traitement des eaux usées tout en réduisant les coûts de traitement.

Le réseau de neurones artificiels (ANN) est un modèle mathématique qui simule le comportement des réseaux de neurones animaux et effectue un traitement de l'information distribué et parallèle. L'ANN est devenu largement utilisé pour prédire les rejets d'eaux usées, car il peut ajuster les interconnexions entre un grand nombre de nœuds internes pour traiter des informations complexes au sein du système9,10,11,12,13.

En plus d'utiliser des méthodes de réseau neuronal artificiel (ANN), d'autres techniques telles que la régression linéaire (LR), la régression vectorielle de support (SVR) et les méthodes de réseau neuro-flou ont également été utilisées dans la technologie d'élimination des polluants pour prédire les changements dans les concentrations de polluants ou d'autres paramètres de processus14,15,16,17,18,19. Ces méthodes (comme le montre le tableau 1) se sont avérées efficaces pour modéliser les relations complexes entre divers facteurs et prédire les concentrations de polluants, ce qui permet d'optimiser les performances du procédé de traitement.

Cependant, malgré ces modèles14,15,16,17 assez performants, leur traitement ou leur environnement est idéalisé. La plupart d'entre eux utilisent des conditions expérimentales simulées. Une fois dans un cas d'ingénierie réel, en raison de sa complexité, les performances du modèle ne seront pas aussi exceptionnelles18,19. De plus, dans ces cas14,15,16,17,18,19, il existe de nombreux types de données d'entrée, telles que DO, pH, conductivité, DBO, DCO, TN, etc., ce qui augmente la charge de travail ou la difficulté d'acquisition des données. Par exemple, il existe un décalage important dans les données mesurées des capteurs DO ; La DBO ne peut être mesurée qu'à l'aide d'une méthode biochimique et ne peut pas être mesurée avec précision en ligne à l'aide de capteurs en raison d'une hystérésis importante. Cependant, bien que la mesure de la DCO puisse être effectuée en ligne, la méthode de mesure chimique en ligne nécessite un contrôle strict des conditions de mesure et un ajout continu de réactifs. La méthode du capteur DCO utilise principalement des capteurs optiques, qui sont significativement affectés par la chromaticité et la turbidité des eaux usées. De plus, le capteur DCO est coûteux pour de petits équipements dispersés, ce qui le rend difficile à vulgariser. Par conséquent, il est nécessaire de développer des capteurs avec une collecte de données stable et précise, une longue durée de vie et un prix bon marché pour remplacer les capteurs avec une stabilité médiocre, une courte durée de vie et des prix élevés.

Cependant, l'algorithme ANN traditionnel est basé sur la théorie asymptotique, le risque empirique ne s'approche du risque réel que lorsque la taille de l'échantillon s'approche de l'infini, de sorte que la taille de l'échantillon est loin de l'infini dans l'application pratique, cela entraîne des problèmes de faible capacité d'extrapolation, vitesse de convergence lente et extremum local20,21,22,23.

Le modèle de forêt aléatoire est l'un de l'apprentissage automatique, qui est devenu l'un des points chauds de la recherche dans le domaine de l'intelligence artificielle, qui a une forte capacité d'apprentissage adaptatif et une capacité de cartographie non linéaire24,25. Il convient à la simulation du processus de traitement des eaux usées avec les caractéristiques de grand retard, de non-linéarité et de multi-variable26,27.

La régression de forêt aléatoire (RFR) est une application critique de l'algorithme de forêt aléatoire (RF), qui est une théorie d'apprentissage statistique développée par Breiman28. La technique RFR consiste à utiliser le rééchantillonnage Bootstrap pour extraire plusieurs échantillons des données d'origine et construire des arbres de décision pour chaque échantillon Bootstrap. Ces arbres de décision sont ensuite combinés pour prédire les résultats, la prédiction finale étant la moyenne des prédictions générées par tous les arbres29.

L'essence de l'algorithme RFR est le modèle d'arbre à décisions multiples, qui effectue des prédictions en combinant plusieurs arbres de décision. L'algorithme présente les avantages d'une précision de prédiction élevée, d'une bonne capacité de généralisation, d'une vitesse de convergence rapide et de moins de paramètres d'ajustement, ce qui peut efficacement éviter le "sur-ajustement" et convient au fonctionnement de divers ensembles de données. Il est robuste à l'extraction variable d'ensembles de données et adapté à l'espace vectoriel variable de très grande dimension. La RFR a été largement utilisée dans de nombreux domaines tels que la médecine, la gestion et l'agriculture30,31,32.

RFR utilise également pleinement des échantillons limités et construit plusieurs modèles d'arbre de décision, ce qui augmente la diversité de l'arbre de décision et améliore la précision du modèle d'intégration d'optimisation final33,34. Le tableau 2 montre les applications connexes de la régression forestière aléatoire.

L'ANN est une sorte d'algorithme d'apprentissage automatique couramment utilisé pour prédire l'effet du traitement des eaux usées45,46,47,48,49. Cependant, l'une des faiblesses majeures de l'ANN est le surajustement, qui peut conduire à une réduction de la généralisabilité du modèle50,51,52. En revanche, le modèle de régression forestière aléatoire (RFR) est un autre algorithme d'apprentissage automatique utilisé pour prédire les effets du traitement des eaux usées. Le modèle RFR présente plusieurs avantages, notamment une précision de prédiction élevée, une efficacité de traitement rapide, une forte capacité de généralisation et n'est pas facilement susceptible de surajustement53,54. Ces caractéristiques font du modèle RFR une option attrayante pour prédire les effets du traitement des eaux usées.

Les chercheurs ont utilisé la RFR pour prédire la concentration de polluants dans l'air ambiant55,56,57,58,59 et l'effet du traitement des eaux usées urbaines60,61,62. Cependant, il existe comparativement moins d'études sur la prédiction et le contrôle des effets du traitement des eaux usées domestiques en milieu rural à l'aide du modèle RFR.

La méthodologie proposée vise à améliorer la prédiction et le contrôle efficace de l'effet de traitement des eaux usées domestiques rurales grâce au développement et à l'utilisation du modèle de capteur logiciel RFR. En utilisant cette approche, on espère établir un modèle de capteur logiciel fiable et robuste qui peut surveiller et analyser avec précision les indicateurs clés du traitement des eaux usées dans les zones rurales. Cela facilitera non seulement l'identification des problèmes potentiels et aidera à leur résolution, mais contribuera également à l'amélioration globale des conditions écologiques locales et des normes de santé publique.

Le capteur logiciel est une méthode couramment utilisée dans la surveillance et le contrôle des processus, qui estime la variable de processus d'intérêt en fonction des mesures d'autres variables faciles à acquérir. L'établissement d'un modèle de capteur logiciel implique généralement la sélection de variables d'entrée pertinentes, la conception du modèle mathématique et la formation du modèle à l'aide de données historiques. Le modèle résultant peut ensuite être utilisé pour la prédiction et le contrôle en temps réel. Les capteurs souples ont été largement appliqués dans divers processus industriels tels que les processus chimiques, le traitement des eaux usées et les centrales électriques. Les avantages du capteur logiciel incluent la rentabilité, la flexibilité et la capacité à gérer des systèmes non linéaires complexes. Le capteur logiciel s'est avéré être un outil précieux pour l'optimisation et le contrôle des processus63,64,65,66.

Le modèle RFR est un algorithme d'intégration développé sur la base de la théorie de l'arbre de décision, qui appartient au type de bagging67. En combinant plusieurs arbres de paniers d'apprenants faibles et en prenant la valeur moyenne pour intégrer plusieurs modèles, le résultat final est obtenu68.

Le modèle RFR utilise la perturbation des échantillons et des attributs, et augmente la "diversité" de l'arbre du panier de l'apprenant faible, de sorte que le résultat final de l'intégration a une grande précision et des performances de généralisation69. Le modèle RFR résout des problèmes pratiques tels que les petits échantillons, les dimensions élevées et la multi-classification, et peut traiter à la fois des données discrètes et des données continues70. Il surmonte les lacunes de la vitesse de convergence lente des réseaux de neurones et nécessite un grand nombre d'échantillons. Il résout également le problème de sur-ajustement ou de sous-ajustement de l'arbre de décision, et a une bonne applicabilité et vulgarisation71. La figure 1 montre le diagramme de RFR.

Schéma du modèle RFR.

La méthode de prédiction générale du modèle RFR est :

(1) Prélever au hasard des échantillons d'échantillons d'apprentissage (n × échantillon) n fois pour former un ensemble d'apprentissage (les échantillons ont été remis après chaque échantillonnage). Répétez r fois pour obtenir des ensembles d'apprentissage :\(D_{1} ,D_{2} , \ldots ,D_{r}\).

(2) Pour chaque ensemble d'apprentissage, k attributs sont sélectionnés au hasard dans l'ensemble d'attributs (m × attribut), \(k = \log 2m\), puis des arbres de panier sont établis :\(f_{1} (x),f_{2} (x), \ldots ,f_{r} (x)\).

(3) La valeur de prédiction finale de la forêt aléatoire est déterminée par la méthode moyenne :\(f(x) = \frac{1}{r}\sum\nolimits_{i = 1}^{r} {f_{i} (x)}\).

Afin d'évaluer les performances du modèle de prédiction de la concentration de DCO, l'erreur quadratique moyenne (MSE) et le coefficient de détermination (r2) sont sélectionnés comme indices d'évaluation. Les indicateurs sont calculés comme suit :

Formule \(\hat{y}_{i}\) pour la valeur prédite du modèle, \(y_{i}\) pour la vraie valeur.

Les caractéristiques du modèle RFR ont été définies dans le tableau 3.

Un réacteur discontinu séquentiel (SBR), recevant les eaux usées d'une zone résidentielle, est préparé dans cette étude. La source des eaux usées domestiques provient de la communauté de Shuyuan dans le district de Pidu, Chengdu, Sichuan, Chine (longitude : 103,88, latitude : 30,82). Les eaux usées s'écoulant dans le SBR comprenaient des eaux usées domestiques qui avaient été filtrées et précipitées. Le réacteur SBR (acier inoxydable, 800 mm × 800 mm × 1200 mm) a été conçu et fabriqué. Le volume de travail du réacteur était de 0,576 m3, respectivement (Fig. 2). Un agitateur et un dispositif d'aération sont installés dans la cuve de réaction.

Structure du SBR.

Les eaux usées qui avaient été filtrées et précipitées ont été pompées dans le SBR. Cette pompe s'appelait la pompe A qui alimentait 0,1856 m3 d'eaux usées au SBR à chaque cycle. La pompe B a transporté le même volume d'eau hors du SBR à la fin du cycle.

Le processus SBR est automatisé et contrôlé par un PIC (circuit intégré programmable) ou un ordinateur monopuce. Le cycle, qui dure 480 min, comprend les étapes suivantes : 30 min de remplissage et d'aération, 330 min d'oxydation et d'agitation (alternance d'aération et d'agitation, avec une durée d'aération de 10 min et une agitation de 20 min), 60 min de décantation et 60 min de décharge. La figure 3 montre la gestion temporelle du fonctionnement du SBR.

Processus de traitement du SBR.

Des prélèvements d'effluents et d'influents de surveillance ont été effectués dans la cuve SBR et dans une cuve de collecte qui laisse passer l'eau filtrée afin de s'affranchir des interférences des boues activées.

Le pH et la température filtrés ont été testés par des capteurs de surveillance fabriqués par LuHeng Co. de Chine (capteur pH:pH LuHeng 6503; capteur température:température LuHeng 229).

La DCO filtrée a été testée par la méthode au dichromate de potassium, le NH3-N a été testé par la méthode de colorimétrie réactive de Nessler (photomètre UV visible SP-756P du spectre de Shanghai) et le TP a été testé par la méthode de détection spectrophotométrique (photomètre UV visible SP-756P du spectre de Shanghai). Le pH et la température ont été mesurés à des intervalles de 10 minutes par des capteurs.

Des capteurs ont été installés à environ 200 mm sous le niveau de liquide le plus bas dans le réservoir de réaction et au-dessus de toute couverture de boue potentielle qui pourrait se former pendant la décantation. Tous les instruments ont été calibrés, entretenus et utilisés conformément aux instructions du fabricant.

Un profil typique pour la DCO a vu une augmentation des concentrations lorsque l'influent a été mélangé avec les eaux usées traitées restant dans le réacteur du cycle précédent. Les concentrations de DCO ont culminé peu de temps après la phase de remplissage. Après ce pic, les concentrations de DCO ont diminué en raison de l'oxydation et de la nitrification du carbone organique72. A environ 250 min, le taux de diminution des concentrations de DCO n'a plus de changement évident et a continué ainsi pour le reste du cycle (Fig. 4).

Profil typique pour COD.

Une montée et une descente cycliques du profil de pH (Fig. 5) pendant la phase d'aération se sont produites, lorsque l'aérateur s'est allumé et éteint, entraînant un pic et un creux à chaque période d'aération du profil de pH. L'augmentation du pH, correspondant à la période d'aération, était probablement, dans ce cas, due à l'extraction du CO273. Les diminutions du profil de pH au cours de la période d'agitation de 20 minutes étaient probablement dues à une activité microbienne qui libère du dioxyde de carbone74.

Profil typique pour le pH.

Comme on l'a constaté, au début du cycle, le pH a chuté plus fort que plus tard, c'est probablement parce que la concentration en DCO diffère : une concentration en DCO plus élevée entraîne une plus grande activité des micro-organismes. En général, le pH diminue à mesure que l'alcalinité est consommée au cours de la progression de la nitrification. La progression de la dénitrification provoque probablement l'augmentation globale du pH au stade moyen et final75.

Une hausse et une baisse cycliques des profils de pH pendant la phase d'aération se sont produites, lorsque l'aérateur s'est allumé et éteint, entraînant un pic et une vallée basse à chaque période d'aération dans les profils de pH76.

Un profil typique de descente en température rapide lorsque l'influent a été mélangé avec les eaux usées traitées restant dans le réacteur du cycle précédent. La température a touché le fond peu de temps après la phase de remplissage. Suite à ce fond, la température a augmenté en raison de l'activité microbienne. A environ 250 min, le taux d'augmentation de la température n'a plus de changement évident et a continué ainsi pendant le reste du cycle. La figure 6 montre le changement de température dans un cycle entier.

Profil typique de température.

Comme on l'a constaté, au début du cycle, la température a augmenté plus fort que plus tard, c'est probablement parce que la concentration des polluants diffère: une concentration de polluants de niveau plus élevé entraîne une plus grande activité des micro-organismes, ce qui est la principale raison du changement de température. La variation globale de la température des eaux usées dans un certain cycle est relativement faible, ce qui est fortement influencé par la conduction thermique et le métabolisme microbien de l'environnement, tandis que le transfert de chaleur mécanique, principalement par les pompes et les aérateurs, a peu d'influence sur la variation de la température de traitement des eaux usées77.

Selon le principe du modèle RFR, le processus de modélisation est divisé en quatre étapes comme suit : (1) la collecte d'échantillons de données ; (2) la détermination et le classement de l'importance des caractéristiques; (3) un nombre différent d'éléments ont été ajoutés au modèle de forêt aléatoire afin de sélectionner la quantité appropriée d'éléments importants ; (4) Modèle RFR appliqué en pratique.

Sur la base des données de processus d'exploitation, le modèle de capteur logiciel RFR est utilisé pour établir le modèle de prédiction DCO de l'effluent SBR, qui réalise la prédiction rapide de la qualité de l'effluent et fournit la base d'un fonctionnement efficace et stable du processus de traitement des eaux usées, comme illustré à la Fig. 7.

L'équilibre technique entre les procédures SBR et l'algorithme RFR.

Dans ce cas, on a observé que les valeurs de température augmentaient avec la réduction de la DCO et ont été considérées comme utiles pour identifier la fin de l'élimination de la DCO.

Au stade précoce de la réaction biochimique, l'anabolisme du micro-organisme est intense, ce qui produit une quantité de CO2. La quantité de CO2 provoquée par l'anabolisme est évidemment supérieure à celle par aération d'après le résultat de la mesure (Fig. 5) au stade précoce. De plus, la matière organique produit de l'acide organique, ce qui fait encore baisser la valeur du pH. Moins de matière organique résiduelle a entraîné une production plus faible de CO2 et d'acides organiques, et la prédominance de la dénitrification dans les étapes moyenne et finale au cours de cette période contribue à une augmentation globale de la valeur du pH. Ainsi, les valeurs de pH ont été observées pour diminuer ou augmenter en fonction de différentes matières organiques et ont été considérées comme utiles pour identifier la quantité résiduelle de DCO.

Un certain nombre de variables d'entrée non traitées et traitées telles que le pH, la température, le changement de pH et de température dans les mesures adjacentes, etc. ont été construites et ajoutées à l'ensemble des variables indépendantes. Les variables d'entrée traitées sélectionnées ont été construites à l'aide des caractéristiques du profil.

L'avantage de ce que le pH et la température ont été pris comme variables non traitées est qu'il est simple et facile de les détecter. De plus, les capteurs de pH et de température sont non seulement peu coûteux, mais ont également une précision de mesure satisfaisante.

Chaque ensemble de variables comprenait une collection unique de variables d'entrée (tableau 4). Dans chaque cycle de 480 min, les données recueillies 0 ~ 30 min et 361 ~ 480 min ont été exclues pour éliminer les effets des périodes de remplissage et de tassement (car ces phases ne faisaient pas partie des phases de réaction biologique du cycle de traitement).

Les données de 40 cycles de traitement ont été recueillies, dont 12 (30 %) ont été séparées au hasard pour être utilisées comme ensemble de données de test, et le reste a été utilisé comme ensemble de données d'apprentissage.

L'efficacité du modèle de capteur souple RFR a été évaluée selon 5 critères. La valeur standard de l'effluent en DCO a été fixée à 30 mg/l. La valeur standard de l'effluent peut varier en raison des réglementations locales. Les critères d'évaluation sont énumérés dans le tableau 5.

Le tableau 6 montre les paramètres liés de l'influent et de l'effluent.

Le coefficient de corrélation de Pearson est une mesure statistique utilisée pour déterminer la force et la direction de la relation linéaire entre deux variables. Les éléments essentiels de l'application du coefficient de corrélation de Pearson dans le classement de corrélation des variables sont : (1) le coefficient de corrélation de Pearson est couramment utilisé dans l'analyse de régression multiple pour sélectionner les variables indépendantes les plus significatives en calculant les coefficients de corrélation entre chaque variable indépendante ; (2) Le coefficient de corrélation varie de − 1 à 1, et plus la valeur absolue est grande, plus la corrélation est forte ; (3) Lorsque la valeur du coefficient de corrélation est proche de 0, cela indique que la corrélation entre les deux variables est très faible et qu'elles peuvent être considérées comme indépendantes.

Afin de garantir l'effet d'entraînement du RFR, la méthode des coefficients de Pearson a été utilisée pour étudier la corrélation des sujets, et les variables à faible corrélation ont été supprimées. Afin d'éviter l'apparition de variables invalides, d'éviter le surajustement et d'améliorer les performances d'apprentissage du modèle, toute variable avec une valeur de coefficient de corrélation de Pearson normalisée, considérée comme le score normalisé d'importance variable, inférieure à 0,01 a été supprimée. Le score normalisé résultant du diagramme d'ordre d'importance variable montre les 12 facteurs affectant la concentration de DCO (Fig. 8). Il a été constaté que ΔT avait la plus grande influence sur la concentration de DCO, suivi de T, Tav, pHapex-nadir, etc.

Classement de chaque score d'importance variable.

Les données de 40 cycles de traitement ont été recueillies. 70 % de l'ensemble des données (28 cycles de traitement) sont sélectionnés au hasard comme ensemble d'apprentissage pour le modèle RFR et 30 % (12 cycles de traitement) sont sélectionnés comme ensemble de test pour vérifier l'exactitude du modèle.

Sur la base du classement des scores d'importance des variables, il est évident que les variables liées à la température occupent les trois premières positions. Par conséquent, on peut conclure que les variables liées à la température jouent un rôle prédominant dans l'analyse des données. Certaines études ont montré que l'activité métabolique des communautés microbiennes dans les bioréacteurs de traitement des eaux usées peut provoquer une augmentation de la température de l'eau78,79. En effet, les micro-organismes présents dans le réacteur produisent une grande quantité de chaleur par la dégradation et le métabolisme de la matière organique, entraînant une augmentation de la température à l'intérieur du réacteur. De plus, il convient de noter que si le pH est effectivement un facteur contributif, son importance n'est pas aussi forte que celle de pHapex-nadir. pHapex-nadir, qui est calculé par la valeur du pH au sommet moins la valeur du pH au nadir pour chaque période d'aération, quantifie efficacement la quantité de dioxyde de carbone générée par l'activité microbienne au cours d'une agitation de 20 minutes.

Afin de sélectionner l'ensemble de variables, différents nombres de variables ont été sélectionnés en fonction de l'importance des variables, puis ont été ajoutés au modèle RFR, comme le montre la Fig. 9. Il a été constaté que lorsque les 7 premières variables étaient sélectionnées, le R2 de l'ensemble d'apprentissage et de l'ensemble de test n'augmentait pas et le MSE ne diminuait évidemment pas, de sorte que les 7 principales variables ont été sélectionnées comme la variable du modèle RF optimisé, spécifique comme suit : ∆T, T, Tav, pHapex-nadir, pH, pHav et ∆pH.

Indices d'évaluation avec différents quantitatifs de variables.

La figure 10 montre la comparaison des concentrations de DCO prévues et mesurées sur l'ensemble de test.

Comparaison des concentrations de DCO prévues et réelles/mesurées.

La tendance à la dégradation de la DCO, ainsi que l'écart entre les valeurs prédites et mesurées, peuvent être observées à partir des variations des courbes illustrées à la Fig. 10. Les valeurs prédites permettent une estimation approximative de l'effet de traitement et du niveau de dégradation des polluants au cours d'un seul cycle. Bien que la précision entre les valeurs réelles et prédites ne soit pas parfaite, le léger écart n'existe qu'au stade initial du processus et disparaît rapidement.

Dans le processus de traitement des eaux usées, le changement de DCO est influencé par divers facteurs incertains dans les conditions de fonctionnement. Ces facteurs peuvent entraîner des différences significatives dans la précision de la prédiction de la DCO au cours des différentes étapes du traitement. Au stade précoce, ces facteurs incertains ont une influence plus forte, ce qui se traduit par une erreur évidente entre les valeurs prédites et mesurées ; au fil du temps, les conditions de traitement ont tendance à se stabiliser et l'impact des facteurs incertains sur les changements de DCO diminue progressivement, entraînant une réduction de l'erreur entre les valeurs prédites et mesurées.

Par conséquent, dans la méthodologie proposée, l'ampleur de l'erreur entre les valeurs prédites et mesurées est principalement affectée par l'étape de traitement. Au début, l'erreur peut être relativement importante, mais au fil du temps, l'erreur diminuera progressivement et finira par atteindre un effet de prédiction plus précis.

La sortie du modèle de capteur logiciel RFR, servant de valeur prédite de la qualité de l'eau dans le scénario donné, peut jouer un rôle déterminant dans l'optimisation du processus de traitement des eaux usées. Ceci peut être réalisé en réduisant la consommation d'énergie et en améliorant l'efficacité des processus chimiques et biologiques. Plus précisément, si la valeur de DCO prévue tombe en dessous du niveau standard de l'effluent, le processus peut passer immédiatement en mode de décantation, l'agitateur et l'aérateur étant éteints, ce qui met fin au cycle. Cette méthode permet de contrôler l'achèvement du cycle par une intelligence artificielle et un système de contrôle automatique, par opposition à une approche de contrôle à temps fixe qui manque de précision. Ceci est illustré à la Fig. 11.

Condition de fin de cycle.

Le tableau 7 montre les résultats d'évaluation de l'ensemble de tests 1–12.

RFR est un modèle d'apprentissage automatique utilisé pour les tâches d'analyse prédictive, en particulier pour les problèmes de régression. RFR est une méthode d'apprentissage d'ensemble qui combine plusieurs modèles d'arbre de décision pour créer un prédicteur plus robuste et plus précis.

L'algorithme RFR sélectionne au hasard des sous-ensembles des variables d'entrée et des échantillons des données d'apprentissage pour construire des arbres de décision, qui sont ensuite combinés dans une forêt. Pendant la prédiction, le modèle RFR agrège la sortie des arbres de décision individuels pour produire une prédiction finale. Cette approche permet de réduire l'impact du surajustement et améliore les performances du modèle sur les données de sortie.

Dans le contexte des usines de traitement des eaux usées, le modèle de capteur logiciel RFR peut être utilisé pour prédire la qualité de l'eau (DCO) à travers des diamètres plus simples, de cette manière des capteurs complexes et coûteux seront remplacés. Bien qu'un véritable capteur DCO puisse être une option, plusieurs raisons ou facteurs peuvent entraîner son inadéquation et entraîner certains problèmes : (1) Les capteurs DCO authentiques coûtent généralement cher ; (2) En raison de la présence de solides en suspension dans les eaux usées, la valeur DCO mesurée par de véritables capteurs DCO peut être instable et présenter des fluctuations importantes ; (3) Certains capteurs DCO authentiques peuvent détecter les composés organiques avec une double liaison avec sensibilité tandis que d'autres composés organiques sans double liaison ne sont pas détectés, de sorte que l'erreur ne peut pas être ignorée.

De plus, le modèle RFR surmonte les inconvénients d'une vitesse de convergence lente et d'un grand nombre d'échantillons nécessitant des réseaux de neurones. Les réseaux de neurones sont des modèles puissants qui peuvent apprendre des modèles complexes dans les données. Cependant, la formation d'un réseau de neurones peut être coûteuse en calcul et nécessiter une grande quantité de données. En particulier, les réseaux de neurones profonds ou les réseaux à grande échelle peuvent mettre beaucoup de temps à converger pendant la formation en raison du grand nombre de paramètres qui doivent être appris à travers de multiples itérations.

En revanche, le modèle RFR est composé de plusieurs modèles d'arbre de décision, chacun formé sur un sous-ensemble aléatoire de données. Cette approche présente des avantages : (1) le modèle RFR ne nécessite pas autant de données que les réseaux de neurones, car chaque modèle d'arbre de décision peut bien fonctionner avec des ensembles de données plus petits ; (2) Le modèle RFR peut être facilement parallélisé, ce qui signifie qu'il peut être entraîné plus rapidement que les réseaux de neurones sur des systèmes informatiques multicœurs.

En comparaison avec les méthodes utilisées dans la technologie d'élimination des polluants (tableau 1), la méthodologie proposée ne nécessite que deux types de données brutes faciles à obtenir, ce qui réduit considérablement la charge de travail d'acquisition de données. La faiblesse de la méthodologie proposée est que la valeur de prédiction n'est pas si précise entre la valeur mesurée et la valeur prédite à la première étape de la progression. De plus, même si les modèles R2 et MSE du RFR ne sont pas satisfaisants, il fonctionne bien pour prédire la précision à la valeur seuil de coupure, comme indiqué dans le tableau 7, ce qui est très préoccupant dans le domaine de l'ingénierie.

Dans l'application pratique de la méthodologie proposée, il est possible que la valeur DCO respecte la norme alors que d'autres indicateurs tels que l'ammoniac ou le phosphore ne le font pas. Pour résoudre ce problème, des modèles de relation peuvent être établis en utilisant le pH et la température comme variables pour prédire les autres paramètres. Cependant, cette approche est limitée aux seules méthodes d'intelligence artificielle. De plus, un système de jugement empirique peut être établi, tel que le temps de traitement des eaux usées étant généralement dans une certaine plage, si les résultats prévus dépassent cette plage, les résultats de sortie de la méthodologie proposée sont réputés nécessiter une modification.

Augmentez la conductivité ou d'autres paramètres facilement disponibles en tant que variables d'entrée pour améliorer la précision de la prédiction. Voici les discussions détaillées :

Des variables telles que la conductivité, le MLSS, l'OD et l'ammoniac peuvent également être utilisées comme prémisses pour prédire la DCO. L'impact sur la précision et l'efficacité de la méthodologie proposée peut être : (1) En général, dans le processus de traitement des eaux usées, la conductivité électrique de la solution montre une tendance à diminuer progressivement, ce qui est lié à la diminution de la valeur DCO, d'où la conductivité électrique peut améliorer la précision et l'efficacité ; (2) MLSS devrait montrer une tendance à augmenter progressivement, cependant, le changement de MLSS n'est pas évident en un cycle (480 min). De plus, la précision du capteur MLSS est facilement affectée par la couleur des eaux usées, cela augmentera évidemment l'incertitude des données mesurées par les capteurs ; (3) Le SBR fonctionne selon la périodicité d'aération-agitation, DO présente un changement de périodicité d'augmentation-diminution, qui n'a évidemment aucune corrélation avec la tendance de changement de valeur de DCO ; (4) Au cours du processus de traitement des eaux usées, la concentration d'ammoniac dans la solution présente généralement une diminution progressive, similaire à la tendance observée dans la DCO. Cependant, dans certains cas, comme un manque d'oxygène dissous qui inhibe la nitrification, il peut n'y avoir aucune réduction significative de la valeur d'ammoniac même lorsque la DCO est réduite. En raison de la nature non synchrone des changements de ces deux paramètres, la prévision de la DCO en utilisant l'ammoniac comme variable peut introduire une incertitude dans l'analyse.

Chiffrer la fréquence d'acquisition des données, comme la collecte de données toutes les 5 minutes, puis il peut être cinq minutes à l'avance pour prédire, ce qui améliore encore l'efficacité de la méthodologie proposée.

Ajoutez l'ammoniac et le phosphore comme cibles de prévision pour équilibrer les indicateurs d'eaux usées organiques et inorganiques et améliorer l'aspect pratique.

Des capteurs simples et stables (pH, température) ont été utilisés pour prédire les valeurs de DCO tout au long du processus. Le modèle RFR utilisé dans l'étude peut être considéré comme un "capteur souple", qui aide à surveiller l'effet du traitement.

Le SBR a été optimisé à l'aide de l'intelligence artificielle et d'un système de contrôle automatique pour augmenter l'automatisation, ainsi que pour économiser du temps et de l'énergie. Les capteurs de pH et de température ont collecté des données, qui ont été entrées dans le modèle RFR, le modèle a ensuite produit des valeurs de DCO en temps réel. Une fois que la valeur de DCO prévue est tombée en dessous de la valeur standard de l'effluent, le cycle s'est terminé en coupant l'agitateur et l'aérateur, et le processus est entré directement en mode de décantation. La méthodologie proposée a remplacé le contrôle à temps fixe, qui n'était pas contrôlé. Dans 12 cas de test, le pourcentage d'élimination de la DCO (%) était d'environ 91,075, tandis qu'une moyenne de 24,25% de temps ou d'énergie a été économisée. Ces résultats démontrent que cette approche peut augmenter la capacité de traitement et réduire la consommation d'énergie, ce qui représente une technologie à faible émission de carbone.

R2 sur l'ensemble de test est d'environ 0,791, bien qu'il ne soit pas trop élevé, mais la précision à la valeur seuil de coupure de DCO est d'environ 91 %, ce qui est acceptable pour la prédiction. Il est assez simple et presque précis d'acquérir l'effet de traitement et le niveau de dégradation des polluants à tout moment. Bien qu'il ne soit pas si précis entre la valeur vraie et la valeur prédite, mais l'embarras ne s'est produit qu'à la première moitié de la progression et il a rapidement disparu. La précision du stade moyen et final est plus importante que celle du stade précoce, la raison du fait ci-dessus est expliquée ci-dessous. L'intelligence artificielle et le système de contrôle automatique ont conduit à une manière optimisée, mais la précision satisfaite de la valeur COD prédite est une condition préalable. Partant de ce constat, les exigences de précision sont différentes à chaque étape d'un scénario contrôlé : dans les étapes intermédiaire et finale, en particulier à l'approche de l'étape de conformité aux normes d'effluents, l'accent est davantage mis sur la précision et l'exactitude. Cependant, au stade précoce, la précision n'affecte pas de manière significative la stratégie de contrôle.

En raison de la non-linéarité et de l'incertitude de la variation de la valeur du pH avec le temps dans le processus SBR, les résultats prédits sont instables en raison d'un algorithme différent et d'un ajustement excessif par la méthode ANN. En raison de la distribution parallèle des informations et du stockage du prétraitement structurel, RFR a une forte tolérance aux pannes et la capacité de s'adapter à l'environnement externe par l'apprentissage. La capacité de reconnaissance des formes et de raisonnement compréhensif ouvre sans aucun doute une large perspective pour la recherche expérimentale.

Une limite de cette recherche est sa focalisation exclusive sur la méthodologie SBR. Cependant, il existe la possibilité de modifier la procédure pour répondre à d'autres technologies, en particulier les systèmes de traitement discontinu des eaux usées. En augmentant la fréquence d'acquisition des données, comme la collecte de données toutes les 5 minutes, il peut être possible de prédire les facteurs jusqu'à cinq minutes à l'avance, améliorant ainsi l'efficacité de la méthodologie proposée. Pour améliorer son caractère pratique, l'ammoniac et le phosphore pourraient être inclus comme cibles de prévision, car cela aiderait à équilibrer les indicateurs d'eaux usées organiques et inorganiques.

Les ensembles de données utilisés et/ou analysés au cours de l'étude en cours sont disponibles auprès de l'auteur correspondant sur demande raisonnable.

Chen, P., Zhao, W., Chen, D., Huang, Z. et Zhang, C. Progrès de la recherche sur les technologies de traitement intégré des eaux usées domestiques rurales : un examen. Eau 14(15), 2439–2439 (2022).

Article Google Scholar

Wang, C. et al. Facteurs révélateurs influençant la variation spatiale de la quantité et de la qualité des rejets d'eaux usées domestiques rurales à travers la Chine. Processus de sécurité. Environ. Prot. 162, 200-210 (2022).

Article CAS Google Scholar

Srivastava, G. et al. Influence des variations des eaux usées sur l'élimination simultanée des nutriments dans un réacteur discontinu de séquençage à grande échelle attaché à un sélecteur pré-anoxique. Int. J. Environ. Sci. Technol. 1, 1–18 (2022).

CAS Google Scholar

Masloń, A. Impact de la distribution inégale des eaux usées sur l'efficacité technologique d'un réacteur discontinu de séquençage. Durabilité 14(4), 2405 (2022).

Article Google Scholar

Alhazmi, HE, Yin, Z., Grubba, D., Majtacz, JB et Mąkinia, J. Comparaison de l'efficacité de la désammonification sous différentes concentrations d'OD dans un réacteur discontinu de séquençage à l'échelle du laboratoire. Eau 14(3), 368 (2022).

Article CAS Google Scholar

Chen, D. & Li, H. Amélioration des performances de nitrification et de dénitrification partielles simultanées des boues granulaires aérobies via une aération conique dans un réacteur discontinu séquentiel pour le traitement des eaux usées municipales à faible résistance et à faible rapport DCO/TN. Environ. Rés. 209, 112743 (2022).

Article CAS PubMed Google Scholar

Schwitalla, P. et al. Ad/désorption de NH4+ dans les réacteurs discontinus de séquençage : simulation, laboratoire et études grandeur nature. Sci de l'eau. Technol. 58(2), 345 (2008).

Article CAS PubMed Google Scholar

Kauder, J., Boes, N., Pasel, C. & Herbell, JD Combinaison des modèles ADM1 et ASM2d dans une simulation de réacteur discontinu de séquençage. Chim. Ing. Technol. 30(8), 1100–1112 (2007).

Article CAS Google Scholar

Wang, J., Zhao, X., Guo, Z., Yan, P. & Gao, X. Une méthode de gestion complète basée sur des réseaux de neurones artificiels pour les économies d'énergie et de matériaux dans les stations d'épuration. Environ. Rés. 211, 113054 (2022).

Article CAS PubMed Google Scholar

Alharbi, M., Hong, P.-Y., Laleg, K. et Taous, M. Détection basée sur un réseau neuronal à fenêtre coulissante de bactéries dans les usines de traitement des eaux usées. J. Process Control 110, 35–44 (2022).

Article CAS Google Scholar

Salim, H., Hilal, L. et Samir, F. Prédiction de la demande biochimique en oxygène des effluents dans une station d'épuration à l'aide d'une approche basée sur un réseau neuronal de régression généralisée : une étude comparative. Environ. Processus. 3(1), 153–165 (2016).

Article Google Scholar

Sharghi, E., Nourani, V., Ashrafi, AA & Gökçekuş, H. Surveillance de la qualité des effluents de la station d'épuration par la méthode du réseau neuronal artificiel basé sur le regroupement. Dessalement. Traitement de l'eau. 164, 86–97 (2019).

Article CAS Google Scholar

Hasanlou, H., Abdolabadi, H. & Aghashahi, M. Application de l'analyse factorielle dans une simulation d'usine de traitement des eaux usées industrielles à grande échelle en utilisant une approche hybride analyse en composantes principales-réseau de neurones artificiels. Environ. Programme. Soutenir. Énergie 34(5), 1322–1331 (2015).

Article CAS Google Scholar

Sadek, AH, Fahmy, OM, Mahmoud, N. & Mostafa, MK Prédiction de l'adsorption de Cu (II) à partir de solutions aqueuses sur de l'aluminium nanovalent zéro (nZVAl) par des techniques d'apprentissage automatique et d'intelligence artificielle. Durabilité 15(3), 2081 (2023).

Article CAS Google Scholar

Faiz, AA, Mahmoud, N., Ismail, R. & Faizal, B. Réseau de neurones artificiels et estimation technico-économique avec traitement tertiaire des eaux usées à base d'algues. J. Water Process Eng. 40, 101761 (2021).

Article Google Scholar

Mohamed, GA & Mahmoud, N. Traitement des eaux contaminées par le diazinon par procédé électro-Fenton : effet des paramètres de fonctionnement, et modélisation des réseaux de neurones artificiels. Dessalement. Traitement de l'eau. 182, 277-287 (2020).

Article Google Scholar

Mithil, KN et al. Réseau de neurones artificiels et estimation des coûts pour l'élimination du Cr(VI) à l'aide d'un adsorbant composite polycationique. Environnement d'eau J. 34(S1), 29–40 (2019).

Google Scholar

Fmahmoud, N., Karam, M., Michael, A. & Ibrahim, MG Chapitre 9 - gestion durable des stations d'épuration à l'aide de techniques d'intelligence artificielle. Soft Comput Tech. Gestion des eaux usées des déchets solides 1, 171–185 (2021).

Google Scholar

Nashia, D. et al. Intelligence artificielle et statistiques multivariées pour une évaluation complète des bactéries filamenteuses dans les stations d'épuration connaissant un gonflement des boues. Environ. Technol. Innov. 19, 1 (2020).

Google Scholar

Alberto, P. et al. Réseaux de neurones : un aperçu des premières recherches, des cadres actuels et des nouveaux défis. Neuroinformatique 214, 242–268 (2016).

Article Google Scholar

Emon, M. & Mohaiminul, I. Un aperçu du réseau de neurones artificiels. Suis. J. Comput. Sci. Appl. 3(16), 1 (2019).

Google Scholar

Kudus, SA et al. Un aperçu de l'application actuelle du réseau de neurones artificiels dans le béton. Adv. Mater. Rés. 626(626), 372 (2012).

Article Google Scholar

Zelin, L. et al. Application des réseaux de neurones artificiels dans le changement climatique mondial et la recherche écologique : un aperçu. Menton. Sci. Taureau. 55(34), 3853–3863 (2010).

Article Google Scholar

Bhattacharjee, A., Murugan, R., Soni, B. & Goel, T. Ada-GridRF : un modèle d'ensemble de forêt aléatoire optimisé pour la recherche sur grille adaptative rapide et automatisée pour la détection du cancer du poumon. Phys. Ing. Sci. Méd. 45(3), 981–994 (2022).

Article PubMed Google Scholar

Sun, D., Xu, J., Wen, H. & Wang, Y. Un modèle forestier aléatoire optimisé et sa capacité de généralisation dans la cartographie de la sensibilité aux glissements de terrain : application dans deux zones du réservoir des Trois Gorges en Chine. J. Terre Sci. 31(6), 1068-1086 (2020).

Article Google Scholar

Mateo, PV, Mesa, FJM, Villanueva, BJ & Alonso, Á. C. Un modèle de forêt aléatoire pour la prédiction de la teneur en FOG dans les eaux usées d'entrée des stations d'épuration urbaines. Eau 13(9), 1237 (2021).

Article Google Scholar

Pengxiao, Z. et al. Un modèle de forêt aléatoire pour la prédiction de l'afflux dans les usines de traitement des eaux usées. Stoch. Env. Rés. Évaluer les risques. 33(10), 1781–1792 (2019).

Article Google Scholar

Olshen, RA, Leo, B. & Jerome, F. Arbres de classification et de régression. Chapman et Hall Press : Londres, Royaume-Uni 1, 10 (2017).

Google Scholar

Ferrante, M., Demarco, P. & Origgi, D. OD177-Régression forestière aléatoire sur les données CT pour prédire la dose efficace et la classe de dose efficace conformément à la nouvelle réglementation italienne. Phys. Méd. 92, S138 (2021).

Article Google Scholar

Srimathi, S., Yamuna, G. & Nanmaran, R. Modèle de régression stochastique basé sur un seuil avec filtre de Gabor pour la segmentation et la classification aléatoire des forêts du cancer du poumon. J. Comput. Théor. Nanosci. 16(4), 1666-1673 (2019).

Article CAS Google Scholar

Cristina, Z. Modélisation du lien entre le risque systémique bancaire et les proxys de liquidité du bilan par des régressions de forêt aléatoires. Admin. Sci. 10(3), 52 (2020).

Article Google Scholar

Yihui, C. & Minjie, L. Évaluation des facteurs d'influence sur la production de thé basée sur la régression forestière aléatoire et la valeur d'impact moyenne. Agric. Écon. 65, 340–347 (2019).

Google Scholar

Luo, Y., Yan, J., Mcclure, SC & Li, F. Facteurs socio-économiques et environnementaux de la pauvreté en Chine à l'aide d'un modèle de régression forestière aléatoire pondéré géographiquement. Environ. Sci. Pollution. Rés. Int. 29(22), 33205–33217 (2022).

Article PubMed PubMed Central Google Scholar

Song, HE, Jianhua, WU, Wang, D. & Xiaodong, HE Modélisation prédictive de la pollution par les nitrates des eaux souterraines et évaluation de ses principaux facteurs d'impact à l'aide d'une forêt aléatoire. Chimiosphère 290, 133388 (2021).

Google Scholar

Zhangwen, SU, Lin, L., Chen, Y. & Hu, H. Comprendre la distribution et les moteurs des concentrations de PM2,5 dans le delta du fleuve Yangtze de 2015 à 2020 à l'aide d'une régression forestière aléatoire. Environ. Monit. Évaluer. 194(4), 284 (2022).

Article Google Scholar

Wang, Q. et al. Reconstruction spatialement explicite de la répartition de la population dans le bassin de la rivière Tuojiang entre 1911 et 2010 à l'aide d'une régression forestière aléatoire. Rég. Environ. Modification 22(1), 1 (2022).

Article Google Scholar

Wang, F. et al. Modélisation de l'hétérogénéité spatiale de la qualité de l'eau basée sur la régression forestière aléatoire et l'interprétation du modèle. Environ. Rés. 202, 111660 (2021).

Article CAS PubMed Google Scholar

Shijun, C. et al. Prévision du ruissellement à moyen et long terme basée sur un modèle de régression forestière aléatoire. Approvisionnement en eau 20(8), 3658–3664 (2020).

Article Google Scholar

Harrison, JW, Lucius, MA, Farrell, JL, Eichler, LW & Relyea, RA Prédiction des concentrations d'azote et de phosphore dans les cours d'eau à partir de capteurs haute fréquence à l'aide de la régression des forêts aléatoires. Sci. Environ. 763, 143005 (2020).

Article ADS PubMed Google Scholar

Weiran, Y. et al. Évaluation de la régression forestière aléatoire et de la régression linéaire multiple pour prédire les concentrations intérieures de particules fines dans une ville très polluée. Environ. Pollution. 245, 746–753 (2018).

Google Scholar

Kronholm, SC, Capel, PD et Terziotti, S. ont extrait statistiquement des variables fondamentales du bassin versant pour estimer les charges d'azote total dans les petits cours d'eau. Environ. Modèle. Évaluer. 21(6), 681–690 (2016).

Article Google Scholar

Shi, GY et al. Modélisation de la réponse des ions négatifs de l'air aux facteurs environnementaux à l'aide de la régression linéaire multiple et de la forêt aléatoire. Éco. Informer. 66, 1 (2021).

Google Scholar

Keramat, JM, Saeid, MS, Mousazadeh, H., Ghasemi, VM & Rahimi, MM Étude en temps réel du taux d'humidité des chips de fruits séchés basée sur des attributs d'image en ligne utilisant kNN et des méthodes de régression forestière aléatoire. Mesure 10, 8899 (2020).

Google Scholar

Balogun, AL & Tella, A. Modélisation et étude des impacts des variables climatiques sur la concentration d'ozone en Malaisie à l'aide d'une analyse de corrélation avec une forêt aléatoire, une régression par arbre de décision, une régression linéaire et une régression par vecteur de support. Chimiosphère 299, 134250 (2022).

Article ADS CAS PubMed Google Scholar

Wang, J. et al. Une méthode de gestion complète basée sur des réseaux de neurones artificiels pour les économies d'énergie et de matériaux dans les stations d'épuration. Environ. Rés. 211, 113054 (2022).

Article CAS PubMed Google Scholar

Fernandez de Canete, J. & Del Saz-Orozco, P. Estimation par détection douce des concentrations d'effluents d'usine dans une station d'épuration biologique à l'aide d'un réseau neuronal optimal. Système expert. Appl. 63, 8–19 (2016).

Article Google Scholar

He, F., Wang, J. & Chen, W. Évaluation de la production plus propre pour les usines de traitement des eaux usées basée sur un réseau de neurones artificiels à rétropropagation. Neuro Quantol. 16(6), 1 (2018).

Google Scholar

Zhao, HY, Huang, FL, Li, L. & Zhang, CY Optimisation du traitement de digestion anaérobie des eaux usées basée sur le réseau neuronal GA-BP. Dessalement. Traitement de l'eau. 122, 30–35 (2018).

Article CAS Google Scholar

Junfei, Q., Gaitang, H., Honggui, H. & Wei, C. Méthode de contrôle du traitement des eaux usées basée sur un réseau neuronal flou récurrent adaptatif. Int. J. Intel. Calcul. Cybern. 10(2), 94-110 (2017).

Article Google Scholar

Watanabe, S. & Yamana, H. Mesure de surajustement des réseaux de neurones convolutifs à l'aide de poids de réseau entraînés. Int. J. Data Sci. Anal. 14(3), 261–278 (2022).

Article Google Scholar

Kai, I., Yuta, O. et Moriya, N. Sur-ajustement d'un égaliseur non linéaire basé sur un réseau de neurones artificiels pour les signaux à plusieurs niveaux dans les systèmes de communication optique. Conférence OPTO, 2020.

Oyedotun, OK, Olaniyi, EO & Khashman, A. Un examen simple et pratique du sur-ajustement dans l'apprentissage des réseaux de neurones. Int. J. Appl. Patt. Reconnaître. 4(4), 307–328 (2017).

Article Google Scholar

Buskirk, TD Arpentage des forêts et échantillonnage des arbres : un aperçu des arbres de classification et de régression et des forêts aléatoires avec des applications dans la recherche par sondage. Surv. Pratique. 11(1), 1–13 (2018).

MathSciNetGoogle Scholar

Matthias, S. & Rosie, YZ L'algorithme de forêt aléatoire pour l'apprentissage statistique. Rester. Génomique Sci. 20(1), 3–29 (2020).

Google Scholar

Kim, B., Cha, JW, Chang, K. & Lee, C. Prévision de visibilité sur la Corée du Sud basée sur une forêt aléatoire. Atmosphère 12(5), 552 (2021).

Article ADS CAS Google Scholar

Massimo, S. et al. Une approche forestière aléatoire pour estimer la matière particulaire quotidienne, le dioxyde d'azote et l'ozone à une résolution spatiale fine en Suède. Atmosphère 11(3), 1 (2020).

Google Scholar

Rubal, DK Evolving Méthode d'évolution différentielle avec forêt aléatoire pour la prédiction de la pollution de l'air. Proc. Calcul. Sci. 132, 824–833 (2018).

Article Google Scholar

Shamsoddini, A., Aboodi, MR & Karami, J. Prévision des polluants atmosphériques de Téhéran basée sur la méthode de sélection aléatoire des caractéristiques forestières. Int. Cambre. Photogramme. Remote Sens. Spatia 4, 483–488 (2017).

Article Google Scholar

Shi, G.-Y. et coll. Modélisation de la réponse des ions négatifs de l'air aux facteurs environnementaux à l'aide de la régression linéaire multiple et de la forêt aléatoire. Écol. Inf. 66, 1 (2021).

Article Google Scholar

Min, JS et al. Identification des principaux effecteurs des émissions de N2O des systèmes d'élimination biologique de l'azote à grande échelle à l'aide d'une approche forestière aléatoire. Eau Rés. 184, 116-144 (2020).

Google Scholar

Vitorino, D. et al. Un algorithme de forêt aléatoire appliqué à la modélisation et à la prévision de la détérioration des eaux usées en fonction des conditions. Proc. Ing. 89, 401–410 (2014).

Article Google Scholar

Buras, MP & Solano, DF Identification et estimation de l'emplacement des sources de pollution industrielle dans le réseau d'égouts. Capteurs 21(10), 3426 (2021).

Article ADS CAS PubMed PubMed Central Google Scholar

Medl, M., Rajamanickam, V., Striedner, G. & Newton, J. Développement et validation d'un capteur souple de densité optique basé sur un réseau neuronal artificiel pour un système de fermentation à haut débit. J. Processus 11(1), 297–307 (2023).

Article CAS Google Scholar

Cong, QM, Bo, G.-H. & Shi, H.-Y. Capteur logiciel intégré de DCO pour station d'épuration basé sur le modèle ASP et le réseau de neurones RBF. J. Meas. Contrôle 56(1–2), 295–303 (2023).

Article Google Scholar

Hema, P. et al. Systèmes de capteurs logiciels robustes pour l'industrie : évalués par une étude de cas en temps réel. J. Meas. Sens. 24, 1 (2022).

Google Scholar

Severino, AGV, De, LJMM & De, AFMU Capteur logiciel industriel optimisé par un PSO amélioré : une approche d'apprentissage des représentations en profondeur. J. Sens. 22(18), 6887–6899 (2022).

Annonces d'article Google Scholar

Dimitriadis, SI & Liparas, D. À quel point la forêt aléatoire est-elle aléatoire ?Algorithme de forêt aléatoire au service des biomarqueurs d'imagerie structurelle pour la maladie d'Alzheimer : à partir de la base de données de l'initiative de neuro-imagerie de la maladie d'Alzheimer (ADNI). Régénération neuronale. Rés. 13(6), 962–970 (2018).

Article PubMed PubMed Central Google Scholar

Jaime, LS et al. Une comparaison des méthodes de sélection de variables forestières aléatoires pour la modélisation de la prédiction de la classification. Système expert. Appl. 134, 93-101 (2019).

Article Google Scholar

Christopher, S., Margaret, GS, Chuck, EB et Anders, K. Classification semi-automatisée de la couverture rocheuse exposée dans les montagnes du sud de la Colombie-Britannique à l'aide d'une approche de forêt aléatoire. Géomorphologie 285, 214–224 (2017).

Article Google Scholar

Hristos, T. & Georgia, P. Un bref examen des forêts aléatoires pour les scientifiques et les praticiens de l'eau et leur histoire récente dans les ressources en eau. Eau 11(5), 910 (2019).

Article Google Scholar

Kamakshaiah, M. & Prasada Rao, SS Applicabilité des prévisions de forêts aléatoires au commerce international des devises : une enquête à travers le langage. Int. J.Bus. Anal. Renseignement. 6(1), 47–57 (2018).

Google Scholar

Shu, FY, Joo, HT & Yu, L. Effet du rapport de demande d'azote/oxygène chimique du substrat sur la formation de granules aérobies. J. Environ. Ing. 131(1), 86–92 (2005).

Article Google Scholar

Tanwar, P., Nandy, T., Ukey, P. & Manekar, P. Corrélation des paramètres de surveillance en ligne, du pH, de l'OD et de l'ORP avec l'élimination des nutriments dans un système de bioréacteur à processus cyclique intermittent. Biorès. Technol. 99, 7630–7635 (2008).

Article CAS Google Scholar

Chang, CH & Hao, OJ Système de réacteur discontinu de séquençage pour l'élimination des nutriments : profils ORP et pH. J. Chem. Technol. Biotechnol. Int. Rés. Environ de processus. Technologie propre. 67, 27–38 (1996).

CAS Google Scholar

Tong, Q., Mao, Z. et Sun, L. Variation de l'OD et de la valeur du pH dans le processus de traitement des lixiviats de décharge par SBR. Proc. Annu. Rencontrer. China Silicate Soc. Environ. Protéger. 325–328 (2007).

Shane, F., Mcdermott, J., Doherty, E., Cooney, R. & Clifford, E. Application de réseaux de neurones et de modélisation de régression pour permettre la conformité aux réglementations environnementales et l'optimisation de l'énergie dans un réacteur discontinu à séquençage. Durabilité 14, 4098 (2022).

Article Google Scholar

Hao, X., Sun, S., Li, J. & Liu, R. Établissement et vérification d'un modèle de température pour le processus de traitement de l'eau. J. Environ. Sci. (Chine) 42(12), 1–11 (2022).

CAS Google Scholar

Pochwała, S. & Kotas, P. Possibilité d'obtenir la chaleur des eaux usées d'une station d'épuration au moyen d'une pompe à chaleur : une étude de cas. Conférence Web E3S 44, 144–144 (2018).

Liang, J., Zhang, P., Cai, Y., Wang, Q. et Zhou, Z. Effets thermiques. Environnement d'eau Rés. Publ. Environnement d'eau Nourris. 92(10), 1406–1411 (2020).

Télécharger les références

La recherche est soutenue par le projet clé de recherche et de développement du plan scientifique et technologique provincial du Sichuan, Chine (22ZDYF1876).

Département de génie des matériaux et de l'environnement, Université technologique de Chengdu, Chengdu, Chine

Qiu Cheng et Li Qianglin

Huicai Environmental Technology Co., Ltd., De Yuan Zhen, district de Pidu, Chengdu, Sichuan, Chine

Zhan Chunhong

Vous pouvez également rechercher cet auteur dans PubMed Google Scholar

CQ, CZ et QL ont rédigé le texte principal du manuscrit ainsi que toutes les figures et tous les tableaux. Tous les auteurs ont examiné le manuscrit.

Correspondance à Li Qianglin.

Les auteurs ne déclarent aucun intérêt concurrent.

Springer Nature reste neutre en ce qui concerne les revendications juridictionnelles dans les cartes publiées et les affiliations institutionnelles.

Libre accès Cet article est sous licence Creative Commons Attribution 4.0 International, qui autorise l'utilisation, le partage, l'adaptation, la distribution et la reproduction sur tout support ou format, à condition que vous accordiez le crédit approprié à l'auteur ou aux auteurs originaux et à la source, fournissez un lien vers la licence Creative Commons et indiquez si des modifications ont été apportées. Les images ou tout autre matériel de tiers dans cet article sont inclus dans la licence Creative Commons de l'article, sauf indication contraire dans une ligne de crédit au matériel. Si le matériel n'est pas inclus dans la licence Creative Commons de l'article et que votre utilisation prévue n'est pas autorisée par la réglementation légale ou dépasse l'utilisation autorisée, vous devrez obtenir l'autorisation directement du détenteur des droits d'auteur. Pour voir une copie de cette licence, visitez http://creativecommons.org/licenses/by/4.0/.

Réimpressions et autorisations

Cheng, Q., Chunhong, Z. & Qianglin, L. Développement et application d'un modèle de capteur logiciel de régression forestière aléatoire pour le traitement des eaux usées domestiques dans un réacteur discontinu de séquençage. Sci Rep 13, 9149 (2023). https://doi.org/10.1038/s41598-023-36333-8

Télécharger la citation

Reçu : 22 février 2023

Accepté : 01 juin 2023

Publié: 05 juin 2023

DOI : https://doi.org/10.1038/s41598-023-36333-8

Toute personne avec qui vous partagez le lien suivant pourra lire ce contenu :

Désolé, aucun lien partageable n'est actuellement disponible pour cet article.

Fourni par l'initiative de partage de contenu Springer Nature SharedIt

En soumettant un commentaire, vous acceptez de respecter nos conditions d'utilisation et nos directives communautaires. Si vous trouvez quelque chose d'abusif ou qui ne respecte pas nos conditions ou directives, veuillez le signaler comme inapproprié.