STRATEGIC PROFESSIONAL LEADERSHIP IN HUMAN RESOURCE MANAGEMENT TOWARD SUSTAINABLE NAVAL EDUCATIONAL INSTITUTION IN INDONESIA
A.K. SUSILO, M.B. PANDJAITAN, A. FAISOL
et al.
The Indonesian Navy educational institution has the task and responsibility to
form reliable and respected human resources for soldiers. However, how is strategic professional leadership in human resource management for sustainable marine educational institutions in Indonesia? This study aims to analyze the factors of strategic professional leadership in human resource management for sustainable marine educational institutions in Indonesia which are supported by the theory of strategic leadership and human resource theory.
This study is supported by a qualitative method approach that examines
both documentary studies and in-depth interviews with participants who are
administrators and education personnel working in Indonesian Navy educational
institutions totaling 20 personnel. The results of the study indicate that twelve factors have a collective role in contributing to effective strategic professional leadership in human resource management. The twelve factors include 1) Visionary Leadership;
2) Strategic Workforce Planning; 3) Talent Acquisition and Retention; 4) Leadership
Development Programs; 5) Performance Management Systems; 6) Employee
Engagement; 7) Diversity and Inclusion; 8) Change Management; 9) Ethical
Leadership Practices; 10) Technology Integration in HRM; 11) Sustainability-
Oriented Policies; 12) Continuous Learning Culture.
Precise Control of the in vivo Fate of Nanomicelles Efficiently Treats Advanced Rheumatoid Arthritis via EGFR/JNK/MMP9 Pathway
Jia N, Gao Y, Yang L
et al.
Na Jia,1 Yunzhen Gao,2 Lan Yang,3 Yani Xu,2 Zhirong Zhang,2 Jingwen Wang,1 Ling Zhang3,4 1Department of Pharmacy, Xijing Hospital, The Fourth Military Medical University, Xi’an, 710032, People’s Republic of China; 2Key Laboratory of Drug Targeting and Drug Delivery Systems, Ministry of Education, West China School of Pharmacy, Chengdu, 610041, People’s Republic of China; 3State Key Laboratory of Polymer Materials Engineering, College of Polymer Science and Engineering, Sichuan University, Chengdu, 610041, People’s Republic of China; 4West China School of Public Health and West China Fourth Hospital, Sichuan University, Chengdu, 610041, People’s Republic of ChinaCorrespondence: Jingwen Wang, The Fourth Military Medical University, No. 127 Changle West Road, Xi’an, 710032, People’s Republic of China, Email wangjingwen8021@163.com Ling Zhang, Sichuan University, No. 24 South Section 1, Yihuan Road, Chengdu, 610065, People’s Republic of China, Email zhangling83@scu.edu.cnPurpose: Förster resonance energy transfer (FRET) technology is a tool for in vivo nanomedicine tracking. Nanomicelle-based drug carriers could improve therapeutic outcome for rheumatoid arthritis (RA). Self-assembled nanomicelles are a major type of them, and their drug-loading stability is seriously affected by the in vivo environment. Therefore, it is critical to understand the status of nanomicelles in vivo at different time points, in order to enable precise control of their dynamics to effectively deliver the drug to inflammatory joint.Methods: We applied FRET technology to elucidate the biofate of nanomicelles in an adjuvant induced arthritis (AIA) mice model and inflammatory larvae zebrafish models. We explored the molecular mechanism of swertiamarin-loaded nanomicelles (SWE-NMs) in improving RA symptoms through network pharmacology, molecular docking and immunofluorescence experiments.Results: Results showed that on cellular level the nanomicelles could enter inflammatory cells and completely release most cargoes in 12 h, while in animals, the majority of nanomicelles was destroyed within 72 h. Hence, we tailored an administration scheme for RA treatment. As expected, we loaded swertiamarin into the nanomicelles (SWE-NMs). The injection every 3 days (SWE-NMs/3) displayed enhanced accumulation in arthritic joints and strong anti-RA therapeutic effect, as well as good safety profile. In addition, network pharmacology, molecular docking analysis and immunofluorescence experiments revealed that SWE-NMs might work by blocking the epidermal growth factor receptor/c-Jun N-terminal kinase/matrix metalloproteinase (EGFR/JNK/MMP9) pathway.Conclusion: In summary, this study elucidated the biofate of nanomicelles with FRET technology in RA treatment, thus providing a basis for rationally improving administration scheme and giving clue for investigating other nano delivery systems. Keywords: nanomicelles, in vivo fate, Swertimarin, Förster resonance energy transfer, efficient treatment, advanced rheumatoid arthritis
AutoMind: Adaptive Knowledgeable Agent for Automated Data Science
Yixin Ou, Yujie Luo, Jingsheng Zheng
et al.
Large Language Model (LLM) agents have shown great potential in addressing real-world data science problems. LLM-driven data science agents promise to automate the entire machine learning pipeline, yet their real-world effectiveness remains limited. Existing frameworks depend on rigid, pre-defined workflows and inflexible coding strategies; consequently, they excel only on relatively simple, classical problems and fail to capture the empirical expertise that human practitioners bring to complex, innovative tasks. In this work, we introduce AutoMind, an adaptive, knowledgeable LLM-agent framework that overcomes these deficiencies through three key advances: (1) a curated expert knowledge base that grounds the agent in domain expert knowledge, (2) an agentic knowledgeable tree search algorithm that strategically explores possible solutions, and (3) a self-adaptive coding strategy that dynamically tailors code generation to task complexity. Evaluations on two automated data science benchmarks demonstrate that AutoMind delivers superior performance versus state-of-the-art baselines. Additional analyses confirm favorable effectiveness, efficiency, and qualitative solution quality, highlighting AutoMind as an efficient and robust step toward fully automated data science. Code is at https://github.com/innovatingAI/AutoMind.
Exploring utilization of generative AI for research and education in data-driven materials science
Takahiro Misawa, Ai Koizumi, Ryo Tamura
et al.
Generative AI has recently had a profound impact on various fields, including daily life, research, and education. To explore its efficient utilization in data-driven materials science, we organized a hackathon -- AIMHack2024 -- in July 2024. In this hackathon, researchers from fields such as materials science, information science, bioinformatics, and condensed matter physics worked together to explore how generative AI can facilitate research and education. Based on the results of the hackathon, this paper presents topics related to (1) conducting AI-assisted software trials, (2) building AI tutors for software, and (3) developing GUI applications for software. While generative AI continues to evolve rapidly, this paper provides an early record of its application in data-driven materials science and highlights strategies for integrating AI into research and education.
Proceedings of the 3rd Italian Conference on Big Data and Data Science (ITADATA2024)
Nicola Bena, Claudia Diamantini, Michela Natilli
et al.
Proceedings of the 3rd Italian Conference on Big Data and Data Science (ITADATA2024), held in Pisa, Italy, September 17-19, 2024. The Italian Conference on Big Data and Data Science (ITADATA2024) is the annual event supported by the CINI Big Data National Laboratory and ISTI CNR that aims to put together Italian researchers and professionals from academia, industry, government, and public administration working in the field of big data and data science, as well as related fields (e.g., security and privacy, HPC, Cloud). ITADATA2024 covered research on all theoretical and practical aspects of Big Data and data science including data governance, data processing, data analysis, data reporting, data protection, as well as experimental studies and lessons learned. In particular, ITADATA2024 focused on - Data spaces - Data processing life cycle - Machine learning and Large Language Models - Applications of big data and data science in healthcare, finance, industry 5.0, and beyond - Data science for social network analysis
DSBC : Data Science task Benchmarking with Context engineering
Ram Mohan Rao Kadiyala, Siddhant Gupta, Jebish Purbey
et al.
Recent advances in large language models (LLMs) have significantly impacted data science workflows, giving rise to specialized data science agents designed to automate analytical tasks. Despite rapid adoption, systematic benchmarks evaluating the efficacy and limitations of these agents remain scarce. In this paper, we introduce a comprehensive benchmark specifically crafted to reflect real-world user interactions with data science agents by observing usage of our commercial applications. We evaluate three LLMs: Claude-4.0-Sonnet, Gemini-2.5-Flash, and OpenAI-o4-Mini across three approaches: zero-shot with context engineering, multi-step with context engineering, and with SmolAgent. Our benchmark assesses performance across a diverse set of eight data science task categories, additionally exploring the sensitivity of models to common prompting issues, such as data leakage and slightly ambiguous instructions. We further investigate the influence of temperature parameters on overall and task-specific outcomes for each model and approach. Our findings reveal distinct performance disparities among the evaluated models and methodologies, highlighting critical factors that affect practical deployment. The benchmark dataset and evaluation framework introduced herein aim to provide a foundation for future research of more robust and effective data science agents.
Addressing Longstanding Challenges in Cognitive Science with Language Models
Dirk U. Wulff, Rui Mata
Cognitive science faces ongoing challenges in research integration, formalization, conceptual clarity, and other areas, in part due to its multifaceted and interdisciplinary nature. Recent advances in artificial intelligence, particularly the development of language models, offer tools that may help to address these longstanding issues. We outline the current capabilities and limitations of language models in these domains, including potential pitfalls. Taken together, we conclude that language models could serve as tools for a more integrative and cumulative cognitive science when used judiciously to complement, rather than replace, human agency.
DeepAnalyze: Agentic Large Language Models for Autonomous Data Science
Shaolei Zhang, Ju Fan, Meihao Fan
et al.
Autonomous data science, from raw data sources to analyst-grade deep research reports, has been a long-standing challenge, and is now becoming feasible with the emergence of powerful large language models (LLMs). Recent workflow-based data agents have shown promising results on specific data tasks but remain fundamentally limited in achieving fully autonomous data science due to their reliance on predefined workflows. In this paper, we introduce DeepAnalyze-8B, the first agentic LLM designed for autonomous data science, capable of automatically completing the end-toend pipeline from data sources to analyst-grade deep research reports. To tackle high-complexity data science tasks, we propose a curriculum-based agentic training paradigm that emulates the learning trajectory of human data scientists, enabling LLMs to progressively acquire and integrate multiple capabilities in real-world environments. We also introduce a data-grounded trajectory synthesis framework that constructs high-quality training data. Through agentic training, DeepAnalyze learns to perform a broad spectrum of data tasks, ranging from data question answering and specialized analytical tasks to open-ended data research. Experiments demonstrate that, with only 8B parameters, DeepAnalyze outperforms previous workflow-based agents built on most advanced proprietary LLMs. The model, code, and training data of DeepAnalyze are open-sourced, paving the way toward autonomous data science.
Applying Deep Learning to Anomaly Detection of Russian Satellite Activity for Indications Prior to Military Activity
David Kurtenbach, Megan Manly, Zach Metzinger
We apply deep learning techniques for anomaly detection to analyze activity of Russian-owned resident space objects (RSO) prior to the Ukraine invasion and assess the results for any findings that can be used as indications and warnings (I&W) of aggressive military behavior for future conflicts. Through analysis of anomalous activity, an understanding of possible tactics and procedures can be established to assess the existence of statistically significant changes in Russian RSO pattern of life/pattern of behavior (PoL/PoB) using publicly available two-line element (TLE) data. This research looks at statistical and deep learning approaches to assess anomalous activity. The deep learning methods assessed are isolation forest (IF), traditional autoencoder (AE), variational autoencoder (VAE), Kolmogorov Arnold Network (KAN), and a novel anchor-loss based autoencoder (Anchor AE). Each model is used to establish a baseline of on-orbit activity based on a five-year data sample. The primary investigation period focuses on the six months leading up to the invasion date of February 24, 2022. Additional analysis looks at RSO activity during an active combat period by sampling TLE data after the invasion date. The deep learning autoencoder models identify anomalies based on reconstruction errors that surpass a threshold sigma. To capture the nuance and unique characteristics of each RSO an individual model was trained for each observed space object. The research made an effort to prioritize explainability and interpretability of the model results thus each observation was assessed for anomalous behavior of the individual six orbital elements versus analyzing the input data as a single monolithic observation. The results demonstrate not only statistically significant anomalies of Russian RSO activity but also details anomalous findings to the individual orbital element.
Quokka: An Open-source Large Language Model ChatBot for Material Science
Xianjun Yang, Stephen D. Wilson, Linda Petzold
This paper presents the development of a specialized chatbot for materials science, leveraging the Llama-2 language model, and continuing pre-training on the expansive research articles in the materials science domain from the S2ORC dataset. The methodology involves an initial pretraining phase on over one million domain-specific papers, followed by an instruction-tuning process to refine the chatbot's capabilities. The chatbot is designed to assist researchers, educators, and students by providing instant, context-aware responses to queries in the field of materials science. We make the four trained checkpoints (7B, 13B, with or without chat ability) freely available to the research community at https://github.com/Xianjun-Yang/Quokka.
AutoKaggle: A Multi-Agent Framework for Autonomous Data Science Competitions
Ziming Li, Qianbo Zang, David Ma
et al.
Data science tasks involving tabular data present complex challenges that require sophisticated problem-solving approaches. We propose AutoKaggle, a powerful and user-centric framework that assists data scientists in completing daily data pipelines through a collaborative multi-agent system. AutoKaggle implements an iterative development process that combines code execution, debugging, and comprehensive unit testing to ensure code correctness and logic consistency. The framework offers highly customizable workflows, allowing users to intervene at each phase, thus integrating automated intelligence with human expertise. Our universal data science toolkit, comprising validated functions for data cleaning, feature engineering, and modeling, forms the foundation of this solution, enhancing productivity by streamlining common tasks. We selected 8 Kaggle competitions to simulate data processing workflows in real-world application scenarios. Evaluation results demonstrate that AutoKaggle achieves a validation submission rate of 0.85 and a comprehensive score of 0.82 in typical data science pipelines, fully proving its effectiveness and practicality in handling complex data science tasks.
ОБҐРУНТУВАННЯ ПОКАЗНИКІВ І КРИТЕРІЮ ОЦІНЮВАННЯ ЕФЕКТИВНОСТІ ЗАСТОСУВАННЯ СИЛ (ВІЙСЬК) ВІЙСЬКОВО- МОРСЬКИХ СИЛ ПІД ЧАС ВИКОНАННЯ ЗАВДАНЬ ЗАХИСТУ ЕКОНОМІЧНОЇ ДІЯЛЬНОСТІ ДЕРЖАВИ НА МОРІ
Євгеній ВДОВИЦЬКИЙ
В умовах повномасштабної збройної агресії російської федерації проти України захист економічної діяльності держави на морі залишається надзвичайно актуальним завданням. Після втрати противником панування в північно-західній частині Чорного моря внаслідок успішних дій Військово-Морських Сил Збройних Сил України та часткового відновлення судноплавства для експорту агропродукції виконання ним завдання щодо перешкоджання ведення Україною економічної діяльності на морі здійснюється у формі гібридних дій. Це обумовлює необхідність застосування сил (військ) Військово-Морських Сил для виконання завдань захисту економічної діяльності держави на морі та, відповідно, оцінювання ефективності виконання таких завдань як в умовах воєнного стану, так і в умовах гібридних дій. Метою статті є обґрунтування показників і критерію оцінювання ефективності застосування сил (військ) Військово-Морських Сил під час виконання завдань захисту економічної діяльності держави на морі. За результатами дослідження головним показником ефективності запропоновано обрати ступінь захищеності економічної діяльності держави на морі застосуванням сил (військ) Військово-Морських Сил, а критерієм ефективності – максимальний рівень значення головного показника, який досягається обраним варіантом складу та порядком застосування сил (військ) Військово-Морських Сил відповідно до прийнятих обмежень. З урахуванням нанесення противником не лише прямих, а й опосередкованих збитків економічній діяльності держави на морі систему показників запропоновано доповнити таким частковим показником, як ступінь зниження перевізної здатності суден на шляхах їхнього руху в морській операційній зоні. Обрані показники та критерій оцінювання ефективності дозволяють здійснювати адекватне оцінювання ефективності виконання силами (військами) Військово-Морських Сил завдань захисту економічної діяльності держави на морі в наявних умовах різними способами та обрання раціональних (найкращих) з них.
Military Science, Societies: secret, benevolent, etc.
Collaboration against infectious diseases in border region between North and South Korea
Jonggeuk Yoon, Yooncheol Choi
This study aims to prepare countermeasures that prevent the spread of infectious diseases including malaria and African Swine Fever (ASF) in regions adjacent to the DMZ and border region between North and South Korea and propose exchanges and collaboration measures between North and South Korea against diseases. For this, we reviewed cases of inter-Korean cooperation promoted by the Korean government or local governments and related studies and examined collaboration and problem factors in health and medicine between North and South Korea. Additionally, rooted by the exchange model for border areas between East and West Germany, we suggest applicable measures in the inter-Korean border areas. We put forward proposals for the continuous and specific development of inter-Korean health and medical cooperation plan on the basis of establishing Committee on Border Areas and Agreement on Health and Medicine by supplementing the limitation of piecemeal approach and support at one-time in North-South Korea relations in the past. Additionally, the current study suggests the need for inter-Korean cooperation at the local government level for joint malaria prevention, and prevention of the spread of livestock infectious diseases.
Computer Science for Future -- Sustainability and Climate Protection in the Computer Science Courses of the HAW Hamburg
Elina Eickstädt, Martin Becke, Martin Kohler
et al.
Computer Science for Future (CS4F) is an initiative in the Department of Computer Science at HAW Hamburg. The aim of the initiative is a paradigm shift in the discipline of computer science, thus establishing sustainability goals as a primary leitmotif for teaching and research. The focus is on teaching since the most promising multipliers are the students of a university. The change in teaching influences our research, the transfer to business and civil society as well as the change in our own institution. In this article, we present the initiative CS4F and reflect primarily on the role of students as amplifiers in the transformation process of computer science.
InnovationInsights: A Visual Analytics Approach for Understanding the Dual Frontiers of Science and Technology
Yifang Wang, Yifan Qian, Xiaoyu Qi
et al.
Science has long been viewed as a key driver of economic growth and rising standards of living. Knowledge about how scientific advances support marketplace inventions is therefore essential for understanding the role of science in propelling real-world applications and technological progress. The increasing availability of large-scale datasets tracing scientific publications and patented inventions and the complex interactions among them offers us new opportunities to explore the evolving dual frontiers of science and technology at an unprecedented level of scale and detail. However, we lack suitable visual analytics approaches to analyze such complex interactions effectively. Here we introduce InnovationInsights, an interactive visual analysis system for researchers, research institutions, and policymakers to explore the complex linkages between science and technology, and to identify critical innovations, inventors, and potential partners. The system first identifies important associations between scientific papers and patented inventions through a set of statistical measures introduced by our experts from the field of the Science of Science. A series of visualization views are then used to present these associations in the data context. In particular, we introduce the Interplay Graph to visualize patterns and insights derived from the data, helping users effectively navigate citation relationships between papers and patents. This visualization thereby helps them identify the origins of technical inventions and the impact of scientific research. We evaluate the system through two case studies with experts followed by expert interviews. We further engage a premier research institution to test-run the system, helping its institution leaders to extract new insights for innovation.
DARWIN Series: Domain Specific Large Language Models for Natural Science
Tong Xie, Yuwei Wan, Wei Huang
et al.
Emerging tools bring forth fresh approaches to work, and the field of natural science is no different. In natural science, traditional manual, serial, and labour-intensive work is being augmented by automated, parallel, and iterative processes driven by artificial intelligence-based experimental automation and more. To add new capabilities in natural science, enabling the acceleration and enrichment of automation of the discovery process, we present DARWIN, a series of tailored LLMs for natural science, mainly in physics, chemistry, and material science. This series relies on open-source LLM, incorporating structured and unstructured scientific knowledge from public datasets and literature. We fine-tuned the models using over 60,000 instruction data points, emphasizing factual correctness. During the fine-tuning, we introduce the Scientific Instruction Generation (SIG) model, automating instruction generation from scientific texts. This eliminates the need for manual extraction or domain-specific knowledge graphs and efficiently injects scientific knowledge into the model. We also explore multi-task training strategies, revealing interconnections between scientific tasks. DARWIN series not only achieves state-of-the-art results on various scientific tasks but also diminishes reliance on closed-source AI models. Our research showcases the ability of LLM in the scientific domain, with the overarching goal of fostering prosperity within the broader AI for science community.
en
cs.CL, cond-mat.mtrl-sci
Шляхи подальшого удосконалення навчання (бойової підготовки) особового складу з урахуванням викликів сучасності
В. А. Бородавка, С. В. Бровченко, Р. Я. Вєдєньєва
et al.
Предметом вивчення в статті є процес навчання, підвищення кваліфікації, підготовки та перепідготовки військових фахівців, під час якого вони набувають психологічної готовності військовослужбовця (підрозділу) до ведення бойових дій в різних умовах. Задача, що вирішується, це обґрунтування шляхів набуття (під час навчання, підготовки та перепідготовки) психологічної готовності до ведення військовослужбовцем (підрозділом) бойових дій за різних умов. В статті розглядається основні сучасні тенденцій набуття психологічної готовності. Так, при підготовці потрібно враховувати гнучкість програми в зв’язку з тим, що кожна людина це окрема особистість, що потребує індивідуального підходу під час роботи командира з особовим складом, навчання. Впроваджені стандарти НАТО вимагають внесення змін до системи підготовки військових фахівців, зміну методики навчання, проведення комплексних занять з одночасним залучанням фахівців (викладачів) різного профілю, удосконалення навчально матеріальної бази з метою створення найбільш реалістичного моделювання стресових ситуацій, які можуть бути під час ведення бойових дій та нестандартних ситуацій за спеціальністю фахівців. Запропоновані заходи, які дозволяють набути психологічної готовності до ведення бойових дій в різних умовах як окремого військовослужбовця, так і підрозділу в цілому під час навчання, підвищення кваліфікації, підготовки та перепідготовки військових фахівців у вищих військово-навчальних закладах.
ОСОБЛИВОСТІ ПОБУДОВИ ПРОГРАМИ НАВЧАННЯ ДЛЯ КУРСАНТІВ ЧЕТВЕРТОГО КУРСУ НА КАФЕДРІ ВОГНЕВОЇ ТА ТАКТИКО-СПЕЦІАЛЬНОЇ ПІДГОТОВКИ НАЦІОНАЛЬНОЇ АКАДЕМІЇ ДЕРЖАВНОЇ ПРИКОРДоННОЇ СЛУЖБИ УКРАЇНИ
Петро ГОРПИНИЧ, Микола СЄРБІН
Уже більше ніж пів року проходить повномасштабна війна російської федерації проти України. Для підтримання високого рівня готовності прикордонникам необхідно постійно удосконалювати професійну підготовку за різними її напрямами. Навчання проходить на всіх етапах служби від солдата строкової служби до офіцера. Національна академія Державної прикордонної служби України це основна кузня майбутніх офіцерів для прикордонного відомства. Під час навчання курсанти Національної академії вивчають різноманітні дисципліни, які необхідні для отримання базової вищої освіти. Залежно від спеціальності та спеціалізації вивчаються як обов’язкові дисципліни, так і професійно-орієнтовані: прикордонна служба, прикордонний контроль та вогнева підготовка.Метою статті є уточнення та розкриття особливостей підготовки курсантів-прикордонників четвертого курсу навчання з дисципліни “Вогнева підготовка”. Для вивчення цього питання проведено аналіз наукової літератури, інтернет-ресурсів, робочих програм інших вищих військових закладів та робіт вчених, які ставлять перед собою завдання дослідити проблеми з вогневої підготовки, шляхи для їх вирішення під час здобуття базової вищої освіти. Розглянуто основний напрям розвитку вогневої підготовки, пошук засобів і методів, а також ефективних шляхів удосконалення вмінь і навичок, спрямованих на підвищення якості професійної підготовки відповідно до сучасних вимог. Також вогнева підготовка передбачає озброєння спеціальними теоретичними знаннями та формування спеціальних умінь і навичок, серед яких – усунення затримок під час стрільби; уміле та безпечне поводження з вогнепальною зброєю; приведення її в бойову готовність; правильне утримання вогнепальної зброї; виконання прийомів швидкісної стрільби в різних умовах, з різних положень та інше. Уточнено, що вогневу підготовку в Національній академії курсанти вивчають протягом чотирьох років. Проведено аналіз занять, які проводяться від 1-го до 4-го курсу навчання. З урахуваннямпідго товки початкових курсів розкрито основні напрями вогневої підготовки з четвертим курсом навчання, а саме: “Використання озброєння при виконанні оперативно-службових завдань з охорони державного кордону України” та “Методика підготовки та проведення занять з вогневої підготовки у підрозділах ДПСУ”. Дійшли висновку, що особливістю побудови програми навчання для курсантів четвертого курсу на кафедрі вогневої та тактико-спеціальної підготовки є те, що крім загальних отриманих знань поводження зі зброєю, тактико-технічних характеристик, виконання вправ стрільб з вивчених зразків, також навчають роботі у складі підрозділу (прикордонного наряду) та методиці викладання занять з вогневої підготовки як майбутніх командирів підрозділів.
Education, Military Science
Training and Evaluating a Jupyter Notebook Data Science Assistant
Shubham Chandel, Colin B. Clement, Guillermo Serrato
et al.
We study the feasibility of a Data Science assistant powered by a sequence-to-sequence transformer by training a new model JuPyT5 on all publicly available Jupyter Notebook GitHub repositories and developing a new metric: Data Science Problems (DSP). DSP is a collection of 1119 problems curated from 306 pedagogical notebooks with 92 dataset dependencies, natural language and Markdown problem descriptions, and assert-based unit tests. These notebooks were designed to test university students' mastery of various Python implementations of Math and Data Science, and we now leverage them to study the ability of JuPyT5 to understand and pass the tests. We analyze the content of DSP, validate its quality, and we find that given 100 sampling attempts JuPyT5 is able to solve 77.5\% of the DSP problems. We further present various ablation and statistical analyses and compare DSP to other recent natural language to code benchmarks.
CENTRAL AND LOGARITHMIC CENTRAL IMAGE CHORD TRANSFORMATIONS FOR INVARIANT OBJECT RECOGNITION
PERJU, Veaceslav, COJUHARI, Vladislav
Pattern descriptors invariant to rotation, scaling, and translation represents an important direction in the elaboration of the real time object recognition systems. In this article, the new kinds of object descriptors based on chord transformation are presented. There are described new methods of image presentation - Central and Logarithmic Central Image Chord Transformations (CICT and LCICT). It is shown that the CICToperation makes it possible to achieve invariance to object rotation. In the case of implementation of the LCICT transformation, invariance to changes in the rotation and scale of the object is achieved. The possibilities of implementing the CICTand LCICToperations are discussed. The algorithms of these operations for contour images are presented. The possibilities of integrated implementation of CICT and LCICT operations are considered. A generalized CICT operation for a full (halftone) image is defined. The structures of the coherent optical processors that implement operations of basic and integral image chord transformations are presented.
Engineering (General). Civil engineering (General), Electronic computers. Computer science